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# 
M. DUGUE a mis à cette tâche tout son coeur, et l'a poursuivie avec 
le dévouement et la compétence qu'on lui connaît. 


On avait, pendant quelque temps, espéré que la publication pourrait 
inaugurer la renaissance du glorieux ‘'Journal de l'Ecole Polytechnique!'. 
Mais de nombreuses difficultés ont empêché la réalisation de ce projet. 


M. DUGUÉ, qui est le rédacteur en chef des ‘'Publications de l'Institut 
de statistique de l'Université de Paris'!', a pensé qu'il était possible dans 
cette voie de ne pas retarder la publication entreprise. 


C'est cette heureuse idée qui permet à l'Institut de Statistique de 
l'Université de Paris!'', de s'associer à l'hommage rendu à M. Paul LÉVY. 


Bien que les activités de l'Institut de Statistique aient été et soient 
encore, par les vues à la fois sages et étendues de ses fondateurs, orien- 
tées vers l'enseignement et les applications des méthodes Statistiques, le 
retentissement de la recherche sur la vie de ces méthodes est immédiat 
et profond, 


C'est ainsi que nous pouvons et devons nous unir à tous ceux qui 
admirent la magnifique et puissante impulsion que l'esprit si riche à la 
fois d'intuitionet de rigueur féconde de M. Paul LEV Ÿ a donnée ,non seule- 
ment à la Théorie des Probabilités, mais aussi à des applications difficiles 


et fort efficaces. 
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RÉPONSE À MONSIEUR DUGUE 


par 


Paul LEVY 
(École Polytechnique) 


M. Dugué, au cours d'une conférence sur une généralisation de ce 
qu'il a bien voulu appeler le théorème de Lévy-Cramér, m'a demandé ce 
qui m'avait conduit à considérer comme vraisemblable ce théorème que je 
ne savais pas démontrer, et a suggéré que ma réponse pourrait paraître 
à côté du texte de sa conférence, dans''un prochain numérodes Publications 
de l'Institut de Statistique de l'Université de Paris'', MM. Fréchet et 
Darmois ont ajouté que toutes les indications que je pourrais donner sur 
mes méthodes de travail et de recherche seraient les bienvenues, 


C'est avec grand plaisir que je vais répondre à des questions posées 
d'une manière si aimable, Mais je veux d'abord remercier ceux qui ont eu 
l'idée d'associer mon nom à ce numéro des Publications de l'Institut de 
Statistique, et tous ceux qui ont collaboré à ce premier volume. Ne 
connaissant pas encore tous leurs noms, je ne peux pas, pour le moment, 
les remercier individuellement. 


L. Je réponds maintenant à la question de M. Dugué. Je rappelle à cet 
effet que mes premiers travaux de calcul des probabilités ont porté sur 
l'extension du théorème de Laplace-Liapounoff, d'après lequel : sis, 
désigne une somme S, de n termes aléatoires indépendants et tous très 
petits, la loi dont dépend S,, après une réduction convenable, diffère très 
peu de la loi de Laplace, Si on précise que chaque terme X, estcentré sur 
sa médiane, que ''petit'' signifie petit par rapport à la médiane de | Sn - Mn|; 
où mn est la médiane de S,, et qu'enfin ‘'très!'!' veut dire arbitrairement, 


on a un énoncé très précis. 


J'avais depuis longtemps remarqué que, dans cet énoncé, on pouvait 
évidemment remplacer ‘très petit'' par ‘''très probablement tous très 
petits'', quand en 1930 ou 1931 je me dis que, ‘'dans cet ordre d'idées, on 
devait pouvoir trouver une condition nécessaire et suffisante", Mais il y a 
une condition préalable ; puisqu'une somme de termes laplaciens indépen- 
dants, petits ou non, est laplacienne, on peut obtenir une somme lapla- 
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cienne, ou presque laplacienne, dans des conditions qui ne peuvent pas 
être considérées comme une application d'un théorème du type Laplace- 
Liapounoff. Pour ce théorème, la condition préalable est alors que chaque 
terme X, de la somme soit très probablement très petit en valeur absolue, 
et le théorème que je pressentais et que je ne pus démontrer qu'en 1934 
est que, si cette condition est remplie, pour que la somme soit presque 
laplacienne, il faut et il suffit que tous les termes soient très petits, sauf 
peut-être dans des cas de probabilité totale très petite. 


Si on ne se restreint pas au cas où la condition préalable est remplie, 
il est évident qu'une somme presque laplacienne peut être obtenue, soit 
dans les conditions du théorème précédent, soit par addition de termes 
presque laplaciens, soit enfin par une combinaison des deux premiers cas, 
certains termes étant presque laplaciens, et les autres étant très proba- 
blement tous très petits. La question se posait de savoir s'il y avait encore 
d'autres possibilités. Si oui, la théorie devenait étrangement compliquée ; 
dans le cas contraire, elle était encore relativement simple, ayant ce 
caractère d'élégance qu'ont souvent les théories mathématiques exactes, 
Or cette seconde hypothèse équivaut exactement au théorème de Lévy- 
Cramér; j'avais besoin de ce théorème pour une théorie que des considé- 
rations esthétiques rendaient vraisemblable, 


Telle est la raison qui acheva en 1934 de me persuader de son exacti- 
tude. Mais il s'était d'abord présenté à mon esprit sous un aspect légère- 
ment différent. Dans mes premiers travaux, et dans mon livre de 1925, 
je m'étais surtout occupé du cas où les S, sont les sommes successives 
d'une série>, X, à termes aléatoires indépendants, Dans le cas d'une série 
convergente, ou presque sûrement convergente, chaque terme isolé n'est 
pas négligeable devant la somme, et il ne peut être question d'appliquer 
un théorème du type Laplace-Liapounoff, Même sans rien savoir sur la 
convergence presque sûre des séries à termes aléatoires, on peut obser- 
ver que cette conclusion subsiste si on sait seulement que les S, sont bor- 
nés en probabilité, et il suffit pour cela, si pour fixer les idées les E(X,) 
sont nuls, que la sérieÿ E (XS) soit convergente., Des exemples bien connus 
dont le plus simple est donné par la représentation décimale (ou la repré- 
sentation binaire) d'un nombre choisi au hasard entre zéro et un, aussi 
bien que le théorème fondamental de mon livre, rendaient évident pour 
moi que dans une telle série on ne devait pas s'attendre à obtenir une 
somme laplacienne, Aussi fus-je très surpris quand M. Fréchet, rencon- 
trant un de ces exemples, crut pouvoir en déduire que ce théorème n'était 
applicable que si les lois des X, ''ressemblaient suffisamment à la loi de 
Gauss'' (il ne disait pas encore loi de Laplace). Il me remit son mémoire, 
un jour de 1928, en sortant du séminaire de M. Hadamard, Pressé de 
savoir d'où venaient ses hésitations à admettre mon théorème, j'en lus 
aussitôt la première page, avant même de sortir du Collège de France. 
Ma réaction fut instantanée : 'INon seulement, me dis-je, il n'y avait pas 
lieu de s'attendre à ce que la somme de cette série soit gaussienne, mais 
il est probable, bien au contraire, que la somme d'une série à termes 
indépendants ne peut pas être gaussienne sans que tous les termes le 
soient''. L'impression qu'une telle série, dont la somme serait gaussienne 
sans que chaque terme le soit, serait quelque chose de trop monstrueux 
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pour exister, me fit croire très vite à l'exactitude de cette hypothèse, qui 
devint le théorème de Lévy-Cramér, 


Je ne me décidai d'ailleurs à publier cet énoncé hypothétique que dans 
mon mémoire de 1934 sur les lois indéfiniment divisibles. J'avais défini 
complètement la structure du semi-groupe formé par ces lois, et cet 
énoncé constituait un curieux complément aux résultats ainsi établis. Un 
énoncé analogue relatif à la loi de Poisson aurait été aussi un intéressant 
complément. Je réponds à ce sujet à une autre question de M. Dugué qui 
m'a demandé si je n'y avais pas pensé. D'une part, rien ne m'avait conduit 
à croire à priori à l'exactitude de cet autre théorème. D'autre part ma 
théorie des lois indéfiniment divisibles m'avait donné l'impression que 
j'étais enfin à même de donner au théorème de Laplace-Liapounoff la 
forme définitive que je pressentais depuis 1931 et dont j'ai parlé plus haut. 
J'y arrivai en septembre ou octobre 1934, à peu près en même temps que 
W.Feller, dont le travail est indépendant du mien, En 1935, je m'occupai 
de l'extension de ce théorème à certaines sommes de variables enchaî- 
nées ; de là naquit la théorie de ce que J. Ville a appelé les martingales. 
C'est en mars 1936 que je reçus la lettre de H. Cramér, qui donnait enfin 
une base solide à l'édifice construit sur un lemme hypothétique. Je pris 
aussitôt la décision d'écrire un nouveau livre, qui m'occupa cinq ou six 
mois. Ce ne fut qu'ensuite que je pus m'occuper de l'arithmétique des lois 
de probabilité, Khintchine en avait déjà donné le théorème fondamental, et 
Raikov avait obtenu son théorème sur la loi de Poisson, Je ne pusque 
prendre le résultat de leurs travaux pour point de départ de nouvelles 
recherches. 


2. J'ai maintenant répondu à M. Dugué. Quant aux questions posées 
par MM. Fréchet et Darmois, il m'a semblé qu'elles portaient surtout 
sur le rôle de l'intuition dans mes recherches, mais aussi un peu sur ma 
psychologie en général. Il est délicat de parler de soi. Il y a des choses 
que j'hésite à dire. Mais j'ai bien souvent regretté de ne pas avoir dit ce 
que j'avais pensé à dire. Dans les cas de ce genre, les psychanalystes 
conseillent de donner libre cours aux sentiments refoulés. Puisque, pour 
une dizaine de pages, le moi a cessé d'être haïssable, j'espère qu'on 
m'excusera d'en consacrer quelques-unes aux regrets dont je viens de 
parier. 


Un jour où il avait le droit de parler de lui-même, M. Hadamard a 
parlé surtout des théorèmes à côté desquels il avait passé sans les voir. 
Je n'étonnerai personne en disant que j'ai aussi des regrets de .cette 
nature. Ainsi, je ne m'explique pas comment je n'ai pas su, avant Wiener, 
donner la définition correcte de la fonction du mouvement brownien; tout 
m'y préparait, tant mes travaux sur la loi de Laplace que l'idée, qui 
m'était familière, que les difficultés de la théorie de la mesure dans une 
sphère de l'espace de Hilbert disparaissaient pour une famille de fonctions 
définies dans un intervalle fini et y vérifiant une condition de Lipschitz. 
Et pourtant je ne l'ai pas fait. 


Mais ce n'est pas de ces regrets que je voudrais surtout parler. Il 
m'est beaucoup plus difficile de me consoler de ne pas m'être décidé, 
dans de nombreux cas, à publier des résultats que j'avais effectivement 
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obtenus. Il y a des cas pour lesquels je n'arrive-plus à m'expliquer mes 
hésitations (1). Dans d'autres cas, j'avais mal apprécié ce qui pouvait, 
dans l'état actuel de la science, intéresser les lecteurs. Trop entraîné 
par le cours intérieur de mes pensées pour être un bon observateur de la 
marche générale de la science, je ne savais que rarement si mes résul- 
tats étaient nouveaux, et je m'en suis longtemps rapporté à un critère qui 
s'est révélé déplorable. Quand j'avais l'impression d'avoir résolu une 
difficulté sérieuse, je me disais : "Si cela était fait, cela se saurait''. 
Cela se savait sans doute, mais je ne le savais pas et c'est ainsi qu'il 
m'arriva, entre autres, de publier en 1930 une note sur la loi du loga- 
rithme itéré presque identique à celle présentée six ans plus tôt par 
A, Khintchine. Si au contraire le résultat obtenu me paraissait évident, je 
me disais l'on se moquerait de moi si je disais une chose si évidente'', et 
je laissais échapper une riche moisson. 


Je pourrais comparer l'impression que j'ai souvent éprouvée dans 
ce dernier cas à celui du voyageur arrivant au sommet d'une montagne ; 
qu'il y arrive après une marche pénible, ou qu'il y soit transporté sans 
effort, le résultat est le même, Il n'a qu'à ouvrir les yeux, et regarder ; 
à quoi bon décrire le paysage ? N'importe qui peut le voir aussi bien que 
lui. Et je ne me disais pas qu'il fallait le décrire pour les habitants de la 
vallée; peut-être aussi pour moi-même : en m'imposant de le décrire, j'en 
aurais mieux vu les aspects essentiels. 


Je ne sais plus à propos de quel théorème dont M, Fréchet me parlait 
un jour, je lui ai répondu ‘mais cela va sans dire''; il me répondit 'tela 
irait encore mieux en le disant''. Je compris qu'il avait raison, et me 
promis de ne plus hésiter à dire même des choses évidentes, Mais il me 
reste d'amers regrets relatifs au passé, Je ne veux pas risquer de lasser 
le lecteur par l'énumération des découvertes que je n'ai pas publiées, et 
me bornerai à raconter une histoire déjà très ancienne. 


C'était en 1902, j'avais juste seize ans et, venant d'une classe de 
rhétorique, entrais au Lycée Saint-Louis, dans celle d'élémentaires supé- 
rieures, sans avoir jamais fait de physique, tandis que mes camarades en 
avaient tous fait deux ou trois ans. Si le cours de mathématiques allait 
trop lentement à mon gré, je fus vite débordé par celui de physique, et, 
quand le professeur parla de "l'accélération proportionnelle à l'élongation'!, 
j'avouai mes difficultés à mon père. Sa réponse m'apprit ce qu'étaient une 
dérivée, une vitesse, une accélération. Ce fut une révélation pour moi; en 
quelques jours, j'avais découvert la théorie élémentaire des dérivées, 
quelques règles de calcul, le théorème de Rolle, et son application à 
l'équation du troisième degré. Ensuite je me mis à la recherche des fonc- 
tions sans dérivées, et arrivai à définir la courbe connue aujourd'hui sous 
le nom de courbe de von Koch. Puis je découvris la propriété des points 
de cette courbe qui correspondent aux valeurs rationnelles du paramètre, 


(1) Ainsi, suivant en 1908 un cours de M. Hadamard à la Sorbonne, j'eus l'idée d'un 
théorème sur le rapport entre le plus grand terme d'une série entière et la somme de 
cette série. Je ne puis dire pourquoi j'attendis 1925 pour lui en parler, et présenter une 
note à l'Académie, Ce n'était certainement pas la crainte d'être mal accueilli qui m'avait 
arrêté. 
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propriété que Cesäro devait en 1906 signaler et célébrer en termes lyri- 
ques, C'était en novembre 1902; j'en parlai à mon père, Je me demande 
s'il ne comprit pas l'intérêt de mes résultats, ou s'il craignait de me voir 
me détourner de mon travail de lycéen. Quoi qu'il en soit, sa réponse fut 
peu encourageante, et d'ailleurs mon esprit se trouva brusquement pola- 
risé dans une autre direction, 


Le professeur commençait à nous parler des séries. La notion de 
série convergente m'était familière depuis longtemps; mais je n'avais 
jamais réfléchi au problème technique qui se posait à propos des séries. 
Après huit jours d'efforts, je compris tout à coup ce qu'on ne nous disait 
pas : il s'agissait d'établir un classement des rapidités de croissance des 
infiniment petits ou infiniment grands usuels, et de situer la coupure qui 
sépare les séries convergentes des séries divergentes. Alors, en quelques 
jours, j'obtins le théorème de Cauchy sur la relation entre les séries et 
les intégrales, les critères de Bertrand et tous les théorèmes de Paul 
Dubois - Reymond ; la nécessité de classer n! m'obligea à découvrir la 
formule de Stirling (à un facteur constant près, que je ne découvris que 
dans la bilbiothèque de mon père). Je m'attaquai ensuite à la croissance 
des nombres premiers, et, en mars 1903, j'étais sûr, quoique sans l'avoir 
démontré, du célèbre théorème des nombres premiers, démontré en 1893 
par M. M. Hadamard et de la Vallée Poussin. Il exprime qu'un certain 
rapport tend vers l'unité; j'avais seulement démontré, en partant de la 
décomposition de n! en nombres premiers,que ce rapport à l'unité comme 
valeur d'accumulation, 


C'est à ce moment que mon attention fut attirée par un livre dela 
bibliothèque de mon père : les leçons sur les séries à termes positifs, 
d'Emile Borel. Il ne contenait, je crois, qu'un théorème nouveau pour 
moi : le théorème de l'auteur lui-même sur les séries convergentes à 
termes décroissants., Mais, constatant que je n'avais rien découvert de 
nouveau sur les séries, je me dis qu'il était sans doute chimérique d'es- 
pérer que mes autres théorèmes soient nouveaux, et je laissai passer les 
ännées. Mon travail sur les nombres premiers fut finalement rédigé et 
montré à mon père en 1905, puis publié dans les Nouvelles Annales de 
Mathématiques, tandis que j'attendis la fin de 1908 pour parler de ma 
courbe à la Société Mathématique de France. 


Cette communication donna lieu à de nombreuses observations des 
auditeurs, notamment Fatou et Bricard. Ce dernier, surtout, se déclara 
très intéressé; mais peu de temps après, il apprit par E. Landau, et 
m'informa, que ma courbe avait déjà été découverte par von Koch et 
étudiée par Cesàro. J'avais d'ailleurs des résultats nouveaux. J'avais en 
effet appliqué les principes de la théorie des probabilités dénombrables, 
que E. Borel devait faire connaître dans son célèbre mémoire de 1909, à 
l'étude des propriétés presque sûres de la courbe au voisinage d'un de 
ses points, choisi au hasard. Mais, découragé parce que mes premiers 
résultats n'étaient plus nouveaux, je renonçai à rien publier. Je l'ai 
regretté par la suite, et me suis seulement décidé en 1938 à étendre mes 
résultats nouveaux à une classe plus générale de courbes et les publier 
dans le Journal de l'Ecole Polytechnique. Il faut d'ailleurs ajouter qu'en 
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1908 je ne connaissais gudre le langage de la théorie de la mesure ni celui 
du calcul des probabilités; je n'ose pas affirmer que j'aurais réellement 
pu à cette époque énoncer les lemmes de E, Borel, que j'utilisais seule- 
ment comme une de ces choses ''qui vont de soi!!, Ce que je regrette 
surtout, c'est de n'avoir pas en 1902 rédigé et publié mes premiers 
résultats sur la courbe de von Koch, Je n'aurais pas devancé cet auteur, 
mais j'aurais devancé Cesàro. 


3. Qu'on me permette maintenant une parenthèse pour parler de 
Landau, Quand il vit mon petit travail sur les nombres premiers, dont j'ai 
parlé tout à l'heure, il m'écrivit pour me faire quelques observations : je 
n'énonçais aucun théorème précis, et, dans mes raisonnements, un point 
manquait de rigueur. Je ne pus que reconnaître que mon travail était mal 
rédigé, mais répondis avec précision à ses deux objections, Il me répondit 
à son tour par une lettre de huit pages :''Je vois avec plaisir que vous 
avez le sentiment de la rigueur, sans lequel on ne peut rien faire en 
mathématiques... Le théorème même des nombres premiers n'est pas ai 
difficile à démontrer que vous le pensez, Permetteza-moi de me servir de 
mes notations, dont j'ai l'habitude (c'était ma première rencontre avec 
son o et son O)''. La démonstration suivait, en moins de sept pages d'une 
large écriture ; elle ne remplirait pas quatre pages de ce journal, 


Je la lus sans effort, vérifiant chaque formule l'une après l'autre, 
Mais l'idée directrice, que rien n'indiquait, m'avait échappé, Aussi relus- 
je plusieurs fois cette lettre au cours des 20 ou 30 années suivantes, et 
toujours avec le même résultat, Puis elle fut perdue par suite de la 
dispersion de mes papiers par les Allemands, et peu d'années après la 
seconde guerre, quand Erdôs vint à Paris exposer la démonstration 
élémentaire du théorème des nombres premiers, qui venait d'être décou= 
verte, je me rendis compte que Landau était mort sans avoir publié la 
sienne, qui était bien plus simple, 


Tout ce que je peux me rappeler, c'est le rôle de la formule 


US logpun, 


P <R 
d'où la formule finale se déduit aisément, 


J'ai déjà raconté cette histoire à quelques savants, notamment à 
G. Pélya, quim'en fit remarquer l'invraisemblance : "Tout le monde sait 
que Landau à consacré beaucoup d'efforts à la recherche d'une démons= 
tration élémentaire de ce théorème, et ne l'a pas trouvée, Je ne sais que 
répondre. J'ai parfois constaté que ma mémoire n'est pas infaillibles 
certains souvenirs peuvent être déformés, Mais je ne peux pas croire que 
j'aie pris pour élémentaire une démonstration qui aurait utilisé la fonction 
de AT Nuj et, pour tout le reste, je suis sûr de ce que je viens de 
dire (1). 


(1) L'hypothèse, a priori peu probable, d'une erreur de Landau, me paraît exclue. 
Si la découverte d'une erreur l'avait obligé à renoncer à publier ce qu'il m'avait &erit, il 
m'aurait sûrement prévenu: il me semble en outre que j'aurais remarqué cette SR rer 
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4. Jereviens à mon sujet, c'est-à-dire à moi-même. Puisque je viens 
de parler des défaillances de ma mémoire, permettez-moi d'en raconter 
une, assez singulière. En 1936 ou 37, j'avais découvert un théorème dont 
j'étais très fier. Il donnait la condition nécessaire et suffisante pour que 


la formule : 
Î 
y(t) = fit dx(u) 
0 


transforme n'importe quelle fonction continue, définie dans (0,1), en une 
fonction continue, C'était simple et élégant, c'était un beau théorème, ou 
du moins je me l'imagine aujourd'hui, Et pourtant je ne l'ai pas publié, 
me disant que j'attendrais la seconde édition de mon analyse fonctionnelle, 
Le moment venu, je ne pus même pas me rappeler l'énoncé de ce théo- 
rème ; les cinq années de la guerre avaient passé, et effacé ce souvenir. 


Il est temps maintenant de répondre par quelques exemples précis à 
la question de MM. Darmois et Fréchet. Je commencerai par l'histoire 
de ma thèse, Dans son cours au Collège de France, M. Hadamard avait 
exposé sa célèbre formule donnant la variation de la fonction de Green. Je 
remarquai qu'elle posait un problème d'intégrabilité et le lui dis, Il me 
répondit qu'il le savait, qu'il avait pensé se réserver ce sujet, mais que, 
puisque j'avais mis la main dessus, il me l'abandonnait, Je lui en ai tou- 
jours gardé une profonde reconnaissance, 


s 


Alors je me mis au travail et, quand je repense à cette époque, je 
retrouve certaines caractéristiques de mon esprit qui n'ont jamais changé. 
D'abord, si je ne sais pas concentrer ma pensée par un effort de volonté, 
il arrive qu'elle se concentre d'elle-même sur le sujet qui m'intéresse; 
mon esprit ‘'se polarise'', Alors je peux penser au même problème nuit et 
jour, pendant plusieurs mois, jusqu'au moment où il me faut parfois un 
long repos pour reconstituer dans mon cerveau les conditions physiologi- 
ques mystérieuses qui me permettront de recommencer. D'autre part, si 
dans certains cas j'ai trop hésité à publier mes résultats, il m'arrive 
aussi d'être trop pressé et d'être obligé de rectifier des erreurs. C'est 
un défaut dont je n'ai jamais pu me guérir, puisque,;encore au début de 1956, 
j'ai présenté à l'Académie des notes contenant plusieurs erreurs. Enfin, 
alors qu'à seize ou vingt ans je me croyais un excellent calculateur, je 
m'aperçois fréquemment, en vérifiant mes calculs, que j'avais commis 
des erreurs, et il y eut des cas où je peux dire que j'ai été d'erreur en 
erreur vers la vérité. Cela se produisit aussi parfois en matière de 
raisonnement, et il y en a un dans ma thèse que je n'ai pu mener à bonne 
fin que parce que des erreurs successives ne m'avaient jamais permis de 
voir qu'une difficulté à la fois. 


Quel fut dans ce travail le rôle de l'intuition? Si j'ai eu parfois l'im- 
pression d'une intuition subite, ce fut lorsque m'apparaissait un problème 
à ma mesure, c'est-à-dire pas trop facile (on se moquerait de moi si...), 
pas trop difficile (à quoi bon se casser la tête contre un mur?) et qui enfin 
me semblait intéressant (et il m'arriva d'écarter comme non intéressants 
des problèmes que je devais juger autrement quelques années plus tard). 
C'est ainsi qu'en me posant le problème de l'intégrabilité de l'équation de 
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M.Hadamard, je fus tout de suite sûr que ce serait mon sujet de thèse. 
Mais je n'eus aucun sentiment intuitif de ce que seraient les résultats. 


5. Il y eut des cas où l'intuition subite est allée beaucoup plus loin. 
Je vais en citer deux, survenus tous les deux pendant des conférences 
faites au séminaire de M. Hadamard. Ils furent très différents, en ce sens 
que dans un cas je fus sûr d'un énoncé sans démonstration; dans l'autre 
c'est au contraire la démonstration qui m'apparut instantanément, dans 
tous ses détails. 


Je commencerai par ce dernier. Il s'agissait du théorème de Fischer 
et F.Riesz, et je suis un peu confus d'avouer qu'en 1927 je ne le connais- 
sais pas. Un auditeur du séminaire, M. Noaïillon, attira mon attention sur 
le fait que, sans ce théorème, on ne pouvait pas, comme je l'avais fait 
dans mes Leçons d'analyse fonctionnelle, affirmer l'identité de l'espace 
des fonctions de carrés sommables et de l'espace de Hilbert, et, avant la 
conférence qu'il fit sur ce sujet, je lui dis que je n'avais pas encore trouvé 
la réponse à son objection. Il commença par définir la notion de conver- 
gence en mesure, Alors la démonstration m'apparut instantanément (peut- 
être en dix ou vingt secondes) dans tous ses détails. Je ne pus réussir à 
suivre M. Noaïillon, qui s'était engagé dans une démonstration affreuse- 
ment compliquée. Au bout d'une demi-heure, n'y tenant plus, je l'interrom- 
pis, et donnai la mienne (je crois d'ailleurs qu'elle n'était pas nouvelle; je 
n'ai jamais fait de recherches sur ce point ; mais là n'est pas la question, 
aujourd'hui), 


Dans l'autre cas, il s'agissait de la conférence de M. Denjoy sur un 
problème de Poincaré relatif aux solutions périodiques des équations 
différentielles, Il parla à un certain moment d'une série qui était presque 
partout divergente, mais dont il espérait venir à bout par des procédés de 
sommation convenables, Je fus sur le point de l'interrompre pour lui dire: 
Vous n'y arriverez pas parce que c'est impossible ; les séries de cette 
nature ne peuvent pas être sommables'',. Ma réaction avait été instantanée, 
mais non moins instantanée la réflexion qui me retint : je n'aurais pas su 
justifier mon affirmation, Ce n'est que le soir que j'écrivis à M. Denjoy 
pour lui dire ce que ‘'des principes généraux de calcul des probabilités me 
permettaient d'affirmer'!. 


Le théorème, auquel je n'avais jamais pensé auparavant et qui s'était 
soudainement imposé à moi, est le suivant : si une série, Xh à termes 
aléatoires indépendants n'est pas presque sûrement convergente, il est 
aussi presque sûr qu'elle n'est pas sommable (et cela pour n'importe quel 
procédé de sommation donné d'avance), sauf dans le cas où elle résulte de 
l'addition d'une série presque sûrement convergente et d'une série numé- 
rique sommable, Mon mémoire sur ce sujet parut en 1935; je crois qu'il 
m'avait fallu quelques semaines pour démontrer le théorème énoncé, et 
justifier son extension au cas considéré par M. Denjoy, où il ne s'agissait 
pas exactement d'une série à termes aléatoires indépendants, 


Je pense qu'il est inutile de multiplier les exemples; ceux que j'ai 
cités suffisent pour marquer une distinction importante. Dans les cas où 
je suis arrivé au sommet d'une montagne, que j'y sois monté pas à pas ou 
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qu'une intuition subite m'y ait transporté, je n'ai eu qu'à regarder devant 
moi, et voir à la fois un théorème et sa démonstration, Dans d'autres cas, 
comme dans le dernier exemple cité, le théorème m'apparut comme un 
sommet voisin, auquel menait une route que je ne faisais qu'entrevoir, 
Dans les cas enfin où c'est le sentiment de l'esthétique d'une théorie qui 
m'a fait croire à son exactitude, ce sentiment ne me donnait aucune indi- 
cation sur la démonstration nécessaire. En outre la conviction même de 
cette exactitude ne se renforçait qu'après une longue période de réflexion. 
Il n'y eut d'exception que pour le théorème qui fut démontré par Cramér, 
qui naquit, comme je l'ai dit, d'une intuition subite relative aux séries 
convergentes, 


6. Ces cas d'intuition presque instantanée ont d'ailleurs été assez 
rares, et je ne pourrai pas en raconter un grand nombre, Par contre, il 
m'est arrivé assez souvent d'avoir des ‘périodes d'intuition'', pendant 
lesquelles je découvrais rapidement les caractères essentiels d'une théorie 
nouvelle. J'ai déjà dit qu'en 1902 j'avais eu deux de ces périodes de travail 
rapide et fécond., Je vais en indiquer deux autres exemples. 


Le premier remonte au printemps 1919. Carvallo, l'éminent directeur 
des études de l'Ecole Polytechnique, m'avait demandé de faire trois confé- 
rences aux élèves de cette école pour leur expliquer le rôle de la loi de 
Gauss dans la théorie des erreurs; je devais leur faire comprendre que 
c'était la loi normale, et que si une erreur n'obéissait pas à cette loi, 
c'était un fait anormal dont il fallait trouver l'explication. J'avais environ 
deux mois pour me préparer. Je parcourus les cours de l'Ecole, les 
traités de J. Bertrand, de E. Borel, de Poincaré lui-même, et ne fus pas 
satisfait. Toutefois je fus frappé par cette phrase de Poincaré : ''J'appelle 
fonction caractéristique de la loi d'une variable X la valeur problème de 
el", Je me mis au travail, remplaçai z par iz, et en trois semaines 
j'avais les bases de la théorie que je pus exposer aux élèves (la rédaction 
de ces leçons existe à l'Ecole, en annexe au cours de G. Humbert ; elle a 
été reproduite sans modification dans les premières années de mon cours). 


J'avais décidé de terminer d'abord la rédaction de mes Leçons d'ana- 
lyse fonctionnelle; j'eus aussi à rédiger moncours de l'Ecole.Je ne songeai 
qu'en 1922 à revenir au Calcul des Probabilités, et complétai mon travail 
par l'étude générale des lois stables. Mon mémoire développé, qui ne fut 
publié qu'en 1924, avait été remis à la Société Mathématique de France en 
octobre 1922, Entre 1919 et cette date, il y avait eu les deux mémoires de 
Lindeberg. 


L'autre exemple se rapporte à la théorie des lois indéfiniment divisi- 
bles. Je n'avais pas remarqué les Notes de B.de Finetti et A.Kolmogoroff 
quand je me dis, au début de 1934, que les lois stables autres que la loi 
de Laplace devaient donner lieu à des processus additifs continus en pro- 
babilité. La théorie générale, qui définit un semi-groupe dont les éléments 
de base sont donnés par la loi de Laplace et celle de Poisson, m'apparut 
très rapidement dans ses traits essentiels. Mais la démonstration du fait, 
dont je ne doutais pas, qu'il n'y a pas d'autre loi indéfiniment divisible, ne 
m'apparut pas aussi clairement, et je mis deux ou trois mois à rédiger 
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mon mémoire sur cette question, qui d'ailleurs laisse à désirer sur cer- 
tains points. Le nouvel exposé que je fis de cette théorie dans mon livre 
de 1937 réalisa un progrès incontestable. 


Les deux exemples que je viens de citer se distinguent essentiellement 
de mes travaux de 1902 mentionnés plus haut parce que, si le travail 
rapide, guidé par quelques notions intuitives, me conduisait à la conviction 
intime que la théorie entrevue était exacte, la justification de cette théorie 
par des raisonnements rigoureux ne s'ensuivait pas immédiatement. 


7. Je répondrai, pour terminer, à une question que le lecteur s'est 
sans doute posée : quelle confiance peut-on avoir dans l'intuition ? Une 
réponse générale est impossible, Chez un Pasteur, un Galois, ou un 
Poincaré, cette confiance pouvait légitimement être très grande. Il sied à 
d'autres d'être plus prudents. 


J'ai déjà dit qu'il m'est arrivé de me tromper ; mais dans la plupart 
des cas je ne crois pas devoir rendre mon intuition responsable de mes 
erreurs. Quelques-unes furent dues à de banales fautes de calcul, d'autres 
à des généralisations trop hâtives de résultats démontrés dans certains 
cas particuliers. Il y a au moins un cas où, un calcul m'ayant conduit à un 
résultat contraire à celui qui me paraissait intuitivement évident, je crus 
devoir m'en rapporter au calcul. Une plus grande confiance dans mon 
intuition m'aurait conduit à vérifier mon calcul avec plus de soin, et à 
découvrir une faute que je ne découvris que plusieurs années plus tard, 
parce qu'en me relisant mon sentiment intuitif fut assez fort pour me 
persuader trop tard qu'il y avait une erreur de calcul (1). De même, à la 
fin de mon livre sur les Processus stochastiques, figurent quelques énon- 
cés étranges qui sont le résultat d'une erreur de calcul; je me souviens 
que j'avais été amusé mais non choqué par cette étrangeté, et qu'il n'est 
pas question de rendre l'intuition responsable de mon erreur, car, en 
faisant le calcul en question, qui devait répondre par oui ou non à un pro- 
blème que je m'étais posé, je ne m'attendais pas à un résultat plutôt qu'à 
l'autre. J'ajoute qu'en un sens cette erreur fut heureuse. C'est en me 
demandant s'il ne restait pas quelque chose de vrai parmi les conséquen- 
ces bizarres que j'en avais déduites que je fus conduit à entreprendre le 
travail que j'ai présenté en 1955 au troisième Symposium de Berkeley; sa 
dernière partie répond affirmativement à cette question. 


Voici pourtant un cas où sans doute mon intuition m'avait trompé. Là 
encore, j'ai un souvenir précis, et bien daté. C'est en août 1922 que je fis 
la connaissance de N. Wiener, qui me parla de ses travaux, et notamment 


de son mémoire sur la série)? sur laquelle il y à bien des choses 
intéressantes à dire''. Ma réaction fut instantanée: l'Cette série estconver- 
gente, et la fonction caractéristique de sa somme est [| cos =. Il ne s'agit 
que d'une application banale d'un théorème général''. Je ne voulus pas 


traiter son problème de banal, et ne dis rien; j'eus évidemment tort. 


(1) 11 s'agit de l'énoncé qui termine le n° 79, 4° de mon livre de 1937 sur les 
Variables aléatoires, et qui est inexact. L'erreur a été rectifiée dans la deuxième édition, 
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Or, en essayant de me rappeler mon état d'esprit à cette époque, je 
crois qu'en réalité je n'avais pas une idée très nette des relations entre 
les différents modes de convergence d'une suite de variables aléatoires. 
Je savais bien entendu que la convergence des fonctions caractéristiques, 
entraîne la convergence en distribution, Mais il me semble aussi que je 
croyais que la convergence en moyenne quadratique est, dans le cas d'une 
série à termes indépendants, la condition nécessaire et suffisante de la 
convergence presque sûre. Or elle n'est pas nécessaire, et, si elle est 
bien suffisante (de sorte que ma réflexion sur la série de Wiener était 
correcte), la démonstration de ce fait est bien moins simple que je ne me 
l'imaginais à cette époque. 

Je laisse au lecteur le soin de dire s'il s'agissait de l'erreur banale 
d'un débutant sur une question mal étudiée, ou d'une intuition trompeuse. 
Mais cela ne saurait changer mon opinion sur le rôle de l'intuition et celui 
de la rigueur dans la recherche scientifique, et je voudrais terminer en 
répétant sous une forme un peu différente ce que j'ai déjà dit bien souvent. 
La rigueur cartésienne n'est pas créatrice. Même avec une machine les 
empêchant d'écrire des phrases dépourvues de sens ou de faire des fautes 
de raisonnement, les singes dactylographes d'Emile Borel ne feraient pas 
progresser la science. Pour faire oeuvre utile, le savant doit avoir, à 
côté du sens de la rigueur cartésienne, des qualités réellement créatrices, 
un sens exact de ce qui est important, un instinct qui lui fera choisir les 
meilleures directions pour ses recherches, une connaissance des méthodes 
qui lui permettront d'avancer dans ces directions, et un esprit inventif qui 
lui fera découvrir de nouvelles méthodes. Or cet instinct, cet esprit inven- 
tif, ne sauraient obéir à des règles toutes faites. Il semble que certains 
savants ont tendance à procéder par bonds brusques, quitte à revenir en 
arrière s'ils ârrivent sur un mauvais terrain; ce sont ceux-là qu'on appelle 
les intuitifs. D'autres sont plus prudents, et je ne saurais le leur repro- 
cher. D'illustres exemples ont prouvé que les uns et les autres sont utiles 
aux progrès dela science.Cequ'il m'arrive de regretter chez les seconds, 
c'est que leur prudence s'accompagne souvent d'une sorte de coquetterie à 
présenter leurs résultats sous une forme parfaitement logique, mais qui 
ne laisse rien voir de la démarche de leur esprit; sans doute cachent-ils 
inconsciemment ce qui est tout de même une forme d'intuition. En le mon- 
trant mieux, en éclairant au préalable par quelques remarques générales 
la route qu'ils vont suivre, ils favoriseraient la compréhension intuitive des 
théories exposées, et rendraient service à leurs élèves. Je voudrais que 
tous les maîtres le fassent (1), ce qui ne les empêcherait pas de rappeler 
qu'il ne faut demander à l'intuition que ce qu'elle peut donner, qu'une 
confiance exagérée en elle serait dangereuse, mais qu'inversement, 
comme l'a dit M. Hadamard :''on ne peut demander à la rigueur que de 
consolider les conquêtes de l'intuition!'. 


(1) J'ai d'ailleurs souvent constaté que, en présence d'un auditoire dont il devine 
la réaction, tel maître dont les travaux sont pour moi difficiles à lire me donne au con- 


traire toute satisfaction dans ses exposés oraux. 
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II E 


Il y a plusieurs mois que les pages précédentes ont été écrites, et je 
regrette de n'avoir pas su profiter de l'occasion pour rendre un hommage 
mérité aux maîtres à qui je dois d'être ce que je suis. Peut-être est-il 
temps de combler cette lacune. 


Il ne saurait être question de dire ici tout ce que je dois à mon père, 
et aussi à ma mère qui fut mon seul professeur jusqu'à mon entrée au 
lycée, en 1895. Mais il n'est sans doute pas déplacé de rappeler que mon 
père, polytechnicien de la promotion 1872, agrégé de mathématiques , 
après avoir été professeur au lycée de Rennes et à Louis-le-Grand, puis 
directeur des études au collège Sainte-Barbe, où je suis né, consacra à 
l'Ecole Polytechnique les 24 dernières années de sa vie. Il avait rempli 
pendant 19 ans, et avec un rare succès, les fonctions d'examinateur 
d'admission, et laissé la réputation de l'examinateur qui ne s'était jamais 
trompé. Il devint examinateur des élèves, pour la mécanique, en rempla- 
cement de Carvallo, nommé directeur des études. Déjà malade, il ne 
voulut pas demander sa retraite, et mourut à la tâche. 


Comme mathématicien, il fut l'auteur d'un mémoire de géométrie 
couronné par l'Académie de Belgique, d'un Précis de la théorie des fonc- 
tions elliptiques, qui fut très utile aux ingénieurs, et, en collaboration 
avec Rouché, d'un traité d'analyse infinitésimale. Rouché, déjà âgé, avait 
entrepris un travail au-dessus de ses forces, et lui avait demandé de 
l'aider ; je crois me rappeler que, pour plus des trois quarts, ces deux 
gros volumes furent l'œuvre de mon père. 


Je ne peux pas non plus dire tout ce que je dois à tous les professeurs 
que j'ai eus aux lycées Montaigne, Louis-le-Grand, et Saint-Louis, dont je 
fus successivement l'élève. Quelques-uns, comme Louis Mangin, Gustave 
Glotz, Emile Mâle, furent des hommes éminents dans leurs spécialités. 
Mais ma reconnaissance va surtout à des hommes plus modestes, quise 
consacraient corps et âme à leur.tâche, et dont beaucoup étaient des édu- 
cateurs remarquables, Je serais tenté d'en faire revivre quelques-uns, 
depuis Augustin Monod, professeur de sixième, que nous adorions et qui 
nous le rendait bien, jusqu'à mon professeur de Spéciales, Emile Blutel, 
un excellent professeur, capable de s'élever bien au-dessus de ce qu'exi- 
geait la préparation au concours de l'Ecole Polytechnique. Mais tout cela 
m'entraînerait trop loin, 


À l'Ecole, où j'entrai en 1904, les plus illustres de nos professeurs 
étaient Henri Poincaré, Henri Becquerel, Georges Humbert, Poincaré 
était professeur titulaire d'astronomie; il avait fait le cours l'année pré- 
cédente, mais ne nous fit que trois leçons, et le reste du cours fut fait 
par un suppléant. Ayant été malade, je n'entendis qu'une de ces trois 
leçons. Bien que je l'aie bien connu quand il accepta d'être rapporteur de 
ma thèse, je ne peux pas dire que j'aie été son élève. 


C'est à Becquerel que je dois la révélation de ce que pouvait être la 
physique. Les programmes des classes préparatoires, remplis par les 
expériences de Regnault, d'Amagat, et d'interminables discussions sur les 
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instruments d'optique, semblaient faits pour dégoûter les élèves de la 
physique. En outre, j'étais venu de Louis-le-Grand où je n'avais pas fait 
de physique, à Saint-Louis où l'on s'adressait à des élèves qui en avaient 
fait deux ou trois ans; la base me manquait. Je ne pus reprendre pied 
qu'à l'Ecole, plus sans doute grâce au cours écrit de Becquerel que grâce 
à son enseignement oral, car il avait la voix trop faible. Mes camarades 
et moi fâmes surtout intéressés par son remarquable exposé des théories 
de Fresnel. 


Mais l'homme qui fit sur nous la plus forte impression fut Humbert, 
Il était vraiment un professeur extraordinaire, parlant avec aisance, et 
rendant clair tout ce qu'il exposait. Quelques-uns de mes camarades 
pensaient même qu'il escamotait des difficultés, qui leur apparaissaient 
au moment de l'étude en salle. Sauf une seule fois, je n'ai jamais constaté 
que ce reproche fût fondé. 


Je retrouvai Humbert à l'Ecole des Mines, où il enseignait la résis- 
tance des matériaux, et au Collège de France. Je ne puis parler de tous 
mes professeurs de l'Ecole des Mines, Beaucoup étaient des savants illus- 
tres. Ceux qui firent sur moi la plus forte impression furent Le Châtelier, 
Cayeux, et surtout Termier, poète de la géologie; il nous enseignait la 
minéralogie, et n'obtint que plus tard la chaire de géologie; mais, même 
si le sujet était aride, il était impossible de ne pas être captivé par la 
manière dont il l'exposait, l'a 


Je reviens à Humbert, et à son cours du Collège de France, qu'il 
faisait deux fois par semaine à midi quarante cinq, pour que les élèves de 
l'Ecole des Mines puissent le suivre. Son cours était très dense; il était 
un virtuose du calcul, ce qui lui faisait gagner du temps, et il exposait en 
une leçon ce qui en aurait rempli deux ou trois d'un professeur ordinaire. 
Après le cours, il rentrait à pied, à l'autre bout de Paris, près du parc 
Monceau, et aimait être accompagné de ses auditeurs, toujours intéressés 
par sa conversation, Fatou, Chapelon et moi le suivions souvent jusqu'aux 
abords du Palais-Bourbon. 


Je suivis à la même époque, deux années de suite, le cours d'Emile 
Picard. Lui aussi était un remarquable professeur, et les sujets qu'il 
exposait m'intéresséient plus que les mathématiques classiques d'Humbert; 
je me souviens surtout d'un admirable exposé de la théorie des fonctions 
orthogonales et du mémoire de Schmidt sur les équations intégrales. 


Mais mon véritable maître, à cette époque, fut M. J. Hadamard, que 
je suis heureux de savoir en bonne santé près de cinquante ans plus tard. 
Je suivis son cours deux années de suite à la Sorbonne, et une troisième 
année au Collège de France. Les sujets qu'il traita successivement furent 
la théorie des fonctions entières, les nombres premiers et la fonction 
Y(s) de Riemann, enfin l'équation À Au = 0. C'est dans ce dernier cours, 
comme je l'ai déjà rappelé, que je trouvai mon sujet de thèse, et il m'aida 
par d'utiles conseils. 


Plus tard, je fus un auditeur assidu de son séminaire, et c'est peut- 
être à ce séminaire que je l'ai le plus admiré. Intéressé, amusé même 
par tous les progrès des mathématiques, il faisait traiter par ses audi- 
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teurs les sujets les plus divers, et, alors que souvent je devais renoncer 
à suivre, je voyais par ses observations qu'aucune nuance de pensée ne 
lui échappait; si parfois il n'était pas sûr de bien comprendre, il posait la 
question voulue pour obliger l'orateur à préciser le point obscur, et rien 
ne restait dans l'ombre. 


Si on peut se dire l'élève de quelqu'un parce qu'on a lu ses oeuvres, 
je fus l'élève d'Emile Borel presque autant que celui de M. Hadamard, 
J'avais essayé de suivre son cours de calcul des probabilités. Mais il 
passa trop de temps sur les notions élémentaires du début, et, après 3 ou 
4 leçons, découragé de n'avoir rien appris, je renonçai. Par contre, j'ai 
lu avec avidité ses premiers livres sur les séries à termes positifs, sur 
les séries divergentes, sur les fonctions entières, et, par la suite, je 
pense avoir lu à peu près tout ce qu'il a écrit. Tout devenait clair, sous 
sa plume et ses livres ont toujours été pour moi la meilleure manière de 
m'initier à des théories que je ne connaissais pas. Je lui dois une grande 
reconnaissance. 


Je ne peux pas ne pas mentionner encore l'influence qu'a eue sur moi 
M. Fréchet, peut-être plus par ses travaux de calcul fonctionnel que par 
ses importantes contributions au calcul des probabilités, et aussi par de 
nombreuses lettres, Il m'a bien souvent rendu service en m'informant de 
priorités que j'ignorais. Sachant que je n'arrivais jamais à faire des 
recherches bibliographiques suffisantes, j'ai souvent pris le parti, avant 
de publier des résultats que je croyais nouveaux, de consulter les savants 
que je savais mieux informés que moi, et il fut un de ceux que j'ai le plus 
souvent consultés. Mais ce n'est qu'un détail, à côté de l'influence qu'a 
eue sur moi l'aspect philosophique de sa pensée, Il est le plus jeune de 
ceux que je peux considérer comme mes maîtres, et je suis heureux qu'il 
ait accepté, ainsi que M. Hadamard, de contribuer à ce volume. 


Enfin je veux encore remercier tous les amis qui y ont contribué, et 
m'excuser auprès de ceux qui auraient pu aussi y contribuer mais n'ont 
pas été invités à le faire. Sachant que tous mes collègues de l'Ecole Poly- 
technique y avaient été invités, j'ai pensé que, pour ne pas grossir exagé- 
rément ce volume, il fallait limiter à un très petit nombre de spécialistes 
du calcul des probabilités les nouvelles invitations adressées à ma 
demande, et je me suis à regret décidé à rayer, sur la liste que j'avais 
d'abord établie, les noms de plusieurs savants français et étrangers que 
je considère comme des amis, 


SUR LE THÉORÈME DE A. HARNACK 


par 
J . HADAMARD 


(Collège de France, Ecole Polytechnique) 


Je m'associe de tout coeur à l'hommage qui est rendu à la belle 
carrière scientifique de Paul Lévy et suis heureux de présenter, pour 
être insérée dans le volume qui lui sera dédié, la démonstration assez 
simple qui peut être donnée d'un résultat qui se montre utile dans la 
théorie des équations aux dérivées partielles. 


On sait le rôle fondamental qui, dans la théorie des fonctions harmo- 
niques, revient au célèbre théorème de A. Harnack : 


Une série de fonctions harmoniques et positives dans un domaine D, 
qui converge en un point intérieur a, converge par cela même en tout autre 
point intérieur, et cela uniformément dans tout domaine D'complètement 
intérieur à 2. Elle peut être différentiée terme à terme. 


Il importait de savoir si une propriété aussi essentielle subsiste lors- 
que, au lieu de fonctions harmoniques, on considère des solutions d'une 
autre équation linéaire du second ordre et du type elliptique. La question 
a été étudiée et une réponse affirmative démontrée dans plusieurs tra- 
vaux contemporains (1) (Le plus récent est une analyse délicate due à 
Mo Je. Serrin (2)): 


Nous allons voir qu'on peut également y aboutir assez simplement en 
utilisant la résolution du problème de Dirichlet à l'aide de la théorie des 
équations intégrales. 


1. Pour l'équation de Laplace ordinaire Au = 0, on considère la solu- 
tion du problème comme représentée par un potentiel de double couche 


di 
fn dS et on a, pour déterminer le moment M de la double couche, 
n 


une équation intégrale 


(1) mt / K (5) m(y)d Sy = ® (x) ee S) 
$ 
où, ici (pour le cas de trois variables) les ® sont, au facteur 2x près, les 
di 
valeurs données à la frontière, K(x,y) étant 1 S 


Pour résoudre des équations intégrales de cette espèce, deux métho- 
des successives ont été indiquées. 


(1) Lichtenstein. Rend, Circ. Mat. Palermo, T. XXXIII (1912), p. 201 ; Feller; 


RER EN ER 
Math. Ann, T. CIl (1930), p. 633. Bers and Nirenberg. Convegno Internationale sulle 
Equazioni Derivate Parziali, 1954, pp. 141-167. 


(2) Journal d'Analyse Mathématique, T. IV (1955-1956), p. 292-308. 
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Celle qui a été donnée par Liouville puis par C. Neumann revient, 
comme on le sait depuis Poincaré, à développer en série entière en À 


] 
(2) me FA 01: de TA ds 


(le premier terme n'étant autre que la donnée @ et les suivants se dédui- 
sant les uns des autres par la formule de récurrence 


(3) Mp+i - fx (y) mp6 à 5, 


la solution de l'équation qui se déduit de (1) par le changement de K enAK. 


La convergence de cette série dépend de la quantité (1) 


(4) J = f1x 6e») d Sy 


Elle est assurée jusqu'à À = 1 si J est inférieur à 1 quelque soit x sur 
S. 

Le procédé en question résoudrait donc le problème si une telle inéga- 
lité avait lieu dans le cas qui nous intéresse. 


Mais ce n'est pas ce qui a lieu : la quantité (4) est égale et non infé- 
rieure à l'unité, de sorte que la convergence de la série (2), certaine pour 
X<1, ne l'est plus pour À = 1 : difficulté à laquelle C. Neumann s'est 
occupé de remédier par un artifice bien connu. 


On y échappe aujourd'hui par la méthode de Fredholm, en représen- 
tant l'inconnue non plus par une série entière en À, mais par le quotient 
de deux séries entières toujours convergentes. Il suffit alors de s'assurer 
que la série dénominateur ne s'annule pas pour X = 1, et c'est ce qui a été 
établi par Plemelj comme conséquence du fait que la solution, si elle 
existait, serait unique. 


2. Voyons ce que deviennent ces différentes circonstances lorsque de 
l'équation Au = 0 on passe à une autre équation du type elliptique (2) 


(e) T (u) Da +228 ve art Cu sf... xn) 


en faisant l'hypothèse, fondamentale dans cette théorie, que le coefficient 
C est essentiellement négatif ou nul, moyennant laquelle le problème de 
Dirichlet ne peut admettre plus d'une solution. Le potentiel W qui rempla- 
cera dans ces conditions le potentiel de double couche classique sera le 


l'potentiel genéralisé'! 
dv 
W - fait ds 


(1) Comme nous nous placerons un peu plus loin dans des conditions où K sera 
positif, le signe | [l pourra alors être supprimé, Q 


(2) Sternberg, Math. Zeitschr. t. XXII (1924), pp. 286-311. 
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en désignant par v la solutionélémentaire(l) analogue au potentiel élémen- 


taire classique et par 4,” <n un point où la surface (ou hypersurface, ou 


courbe) S a un plan tangent de cosinus directeurs l,, 0, ,... bn » la dérivation 


dia 1 Ù ù 
av 22 (TE ti) 


Un tel potentiel subit en un point a de S des discontinuités tout analo- 
gues à celles qui affectent le potentiel de double couche classique : en 
désignant par W;, W,, W, les valeurs vers lesquelles il tend suivant qu'on 
s'approche de à par l'intérieur de D, par l'extérieur (domaine complé- 
mentaire D!) ou par un chemin situé sur S même, on a (Métant supposé 
continu en a) 


il 


Wi 


Ws = We tw'(a) ma) 


We +w (a) ma) 


(5) 


Le coefficient w (a) est une intégrale (2) 


dQ 
É (m -2) " PTE 
(6) (o) & (084, ps usa) 


étendue à la sphère Q de rayon 1 décrite par le point (x,,4,,...,æ&n):inté- 
grale qui représente, pour une position quelconque de à à l'intérieur de 
D, l'intégrale 


: dv(x;a) 


w !, représentant l'intégrale analogue lorsque à est sur S, n'estautre 
que l'intégrale (6), mais étendue cette fois seulement à un hémisphère, 
délimité par le plan diamétral tangent à S. 

Or ce second coefficient est la moitié du précédent (2) ; autrement dit 


la discontinuité, lorsque a, venant de D, traverse S puis passe dans Dr, 
s'opère en deux temps égaux, comme dans le cas habituel, 


La valeur de W; - W , telle qu'elle résulte de (5), donne l'équation 

intégrale en Mm lorsque ® = W est donné tout le long de S, savoir 
1 d 5 

m (x) = ie +1 né ti as 
w =!  U -W dv y 
et le dénominateur w -w' est, d'après ce que nous venons de voir, égal 
àw',. 

Si, pour cette équation, nous voulons former la quantité (4), nous 


voyons que l'intégrale frs d S est précisément, pour un point x pris 


(1) E.E. Levi, Rendic. Circ. Mat. Palermo, t. XXIV (1907), pp. 276-317. 


(2) (x) est la forme métrique, forme quadratique réciproque de # => ALU à 
sa valeur ne change donc pas si l'on remplace une direction & par la direction diamétra- 


lement opposée. 
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sur S, ce que nous avons appelétW'. Il en résulte que, toujours comme 
dans le cas newtonien, la quantité al (où nous ne tenons pas compte du 
signe | |) est identiquement égale à un. 


Ainsi notre équation intégrale, avec introduction du paramètre À en 
facteur du terme intégral, peut se traiter par la méthode d'itération de 
Liouville-Neumann pour 0<X<1, Pour À = 1, au contraire, il faut recou- 
rir à la méthode de Fredholm, donc s'assurer que le dénominateur de 
Fredholm n'est pas nul, Or à cet égard (1) la démonstration de Plemel)j 
s'applique exactement comme dans le cas newtonien, étant donnée l'hypo- 
thèse que nous avons stipulée sur le coefficient C. 


4, Prenons en particulier pour S, à l'intérieur de D, une sphère. 
Nous allons montrer que, si cette sphère a été prise suffisamment petite, 


dv Se 
le noyau mer est positif sur toute sa surface. 


On obtient pour ce noyau la valeur approchée 


m-2 
TUE (o) cos(r,n) 


moyennant les deux approximations suivantes : 


m-2 

On a réduit la solution élémentaire à sa partie principale vo = M ns 2 

et les dérivées premières de v aux dérivées correspondantes de vw, , en 
désignant par [ la forme # (x,- 5x0 anse Em ame 


rai z me Tr 
On a aussi, en prenant la dérivée, négligé le fait que les coeffi- 


cients de la forme # sont fonctions des X. 


Ces deux approximations n'altèrent la valeur obtenue que d'une quan- 
tité inférieure en valeur absolue à q/r"-2, où q sera un nombre indépendant 
des positions des points x et a sur S. L'erreur relative ainsi commise 
sera donc en général infiniment petite avec r. 


Elle cessera de l'être lorsque les deux points pris sur la surface 
sphérique seront infiniment voisins, Mais le rayon R de la sphère pourra 
être pris assez petit pour que, même pour de tels points, notre valeur 
approchée l'emporte sur l'erreur q/r""?: car le facteur positif cos(r,n) 
est égal à r/2R. On peut donc faire que non seulement la valeur approchée 
précédente, mais la valeur véritable du noyau, soient partout positives, 


Dès lors, pour < 1, la solution sera forcément positive du moment 
qu'il en est ainsi pour le terme connu ® : car, dans la série (2) qui la 


fournit, les termes successifs seront tous positifs dans ces conditions. 


5. Qu'il en soit de même quand X = 1, c'est ce qui résulte de l'obten- 
tion de cette même solution par la méthode de Fredholm, La solution 


(1) Sternberg, loc. cit. p. 307, 
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reste continue pour À = l, puisque nous savons que cette valeur deXx 
n'annule pas le dénominateur. Ainsi : 


Une solution de l'équation (€), positive dans toute une sphère de rayon 
suffisamment petit, y est représentable par une potentiel de double couche 


généralisée distribuée sur la surface avec un moment partout positif. 

Ce résultat entraîne immédiatement celui que nous avions en vue : le 
rapport ut/ua des valeurs que prend une même solution positive en deux 
points intérieurs donnés a,b est nécessairement compris entre le minimum 

è dv (x b) dv (x,a nY 
et le maximum du rapport Ce: ns) lorsque x décrit S. 
dv, dv, 

De même toutes les séries dérivées seront uniformément convergen- 
tes. D étant un symbole de dérivation quelconque, le rapport | Dou | us 
dv dv 


est borné par max, Das ee 


6. Malgré la nécessité où nous avons été de prendre chaque sphère 
suffisamment petite, le résultat s'étend, comme dans le cas classique, à 
des positions quelconques des points a et b, en introduisant une chaine de 
sphères dont la première contiendra à son intérieur le point a, la dernière 
le point b et dont chacune sera sécante à la précédente, 


La conclusion finale de Harnack en ressort également : une série dont 
les termes sont positifs et satisfont, dans le domaine (convexe) D à l'équa- 
tion (£}), si elle converge en un point a intérieur à D, converge en tout 
autre point intérieur, et cela uniformément dans tout domaine inté rieur D'; 
elle peut être dérivée terme à terme. 
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SUR LA DISTANCE DE DEUX LOIS 
DE PROBABILITÉ 


par 


Maurice FRECHET 


RESUME : L'auteur indique une expression explicite de la distance de deux 
lois de probabilités, selon la première définition de Paul Lévy. Il indique 
aussi une modification commode de cette définition. 


INTRODUCTION 


M. Paul Lévy a résolu tant de problèmes qu'il n'a pas toujours eu le 
temps d'exploiter toutes ses idées, 


Par exemple, il a donné (1) trois intéressantes définitions de la dis- 
tance ''de deux lois de probabilité'' en laissant aux lecteurs le soin de les 
utiliser. 


J'ai pensé qu'une bonne manière de rendre hommage à l'oeuvre si 
riche de M. Paul Lévy, consisterait à prolonger son étude. 


Après une brève comparaison de ses trois définitions, j'étudierai 
plus particulièrement la première. 


Mon étude a été facilitée par les résultats énoncés dans ma note aux 
C.R. (2) ‘'Sur les tableaux de corrélation dont les marges sont données'! et 


par l'application qui en a été donnée par Bass (3) et par Dall'Aglio (4). 


Rappel : 
Rappelons que : 


Une distance est définie sur un ensemble E si l'on associe à tout 
couple a,b d'éléments de E, un nombre réel appelé distance de a et de b 
et représenté par la notation (a,b), de façon à vérifier les conditions 
suivantes : 


1° (a,b)=(b,a)20 ; 


2° (a,b) 0 si a et b sont considérés comme distincts dans E et inver- 
sement ; 


(1) Voir p. 329 de la 2e édition de notre ouvrage : ‘'Recherches théoriques moder- 
nes sur le Calcul des Probabilités (Premier livre), chez Gauthier-Villars, 1950. 


(2) Tome 242, 1956, p. 2426-2428. 
(3) C.R. 21 février 1955, tome 240, n° 8. 


(4) Sugli estremi dei momenti delle funzione di ripartizione doppia (Ann. Scuole 
Norm. Sup. di Pisa, Sc. Fis. a Mat., série III, Vol. X, 1956, p. 35-74). 
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3° Pour 3 éléments quelconques a, b, c de Et on a ‘'l'inégalité trian- 
gulaire'' : 
(a,b)&(a,c) +(c,b). 


En outre, dire que an de E converge vers a de E, c'est dire que la 


: 1 
distance (an, a) tend vers zéro avec — 


Distinction entre deux l'distances!! : 


Appliquons cette définition au Calcul des Probabilités. Dans cette 
théorie, il y a deux distances à distinguer. Soient X, Y deux éléments 
aléatoires, déterminés simultanément dans chaque épreuve d'une catégorie 
déterminée. 


On peut définir une distance (X,Y)de X, Y dans une épreuve détermi- 
née. Mais il y a aussi intérêt à définir une ''distance globale'' de X et Y 
dans l'ensemble des épreuves. Nous représenterons cette distance globale 
par la notation : 


( [x] ; [1 ). 

Il faudra s'assurer à chaque fois que les conditions 1°, 2°, 3° sont 
vérifiées, Mais en général, on conviendra, en ce qui concerne la condition 
2°, de considérer comme non distincts deux éléments aléatoires qui ne 
sont que ‘'presque certainement'' identiques, Par exemple, nous avons 
prouvé que : 

Prob (X # Y) 


est une distance globale, 


Une distance globale plus souvent considérée est rappelée en note ci- 
après. Pour nous en tenir au cas où X, Y sont deux nombres aléatoires, 
observons que pour déterminer une distance globale, il ne suffit pas de 
connaitre les fonctions de répartitions respectives : 


F (x) = Prob.(X=x) ; G(y) = Prob.(Y—<y) 


qui déterminent les lois de probabilité L, L' de X et de Y, mais aussi la 
fonction de répartition : 


H(x;,y) = Prob.(X< x et Y—y) 
du couple ordonné X,Y (1). 


Au contraire, la distance (L,L') des deux lois L, L', doit être déter- 
minée indépendamment de H(x,y) par F(x)et G(y). 


(1) Par exemple, on prend souvent comme ‘distance globale'' de X et de Y, la 


quantité 
V4 (xx = INRREETE 


09 
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Les deux dernières définitions de (L,L') par P. Lévy sont purement 
analytiques. Elles se présentent comme modifications de définitions tradi- 
tionnelles en Analyse de la distance de deux fonctions F et G, modifications 
motivées par les discontinuités possibles des deux fonctions F et G. 


La première définition proposée par M. Paul Lévy est, au contraire, 
une définition qui pourrait légitimement paraître arbitraire et artificielle 
(si on l'énonçait sous forme purement analytique) à un mathématicien 
ignorant du Calcul des Probabilités. Elle fait, en effet, appel à la notion 
de nombre aléatoire et c'est quand on fait effectivement appel à cette notion 
qu'elle prend, au contraire, un sens intuitif et naturel. 

Il va être curieux de constater que cette première définition conduit à 
une expression explicite assez simple de la distance, contrairement à ce 
qu'on aurait pu attendre. 


Rappel : 
La première définition proposée par M. Paul Lévy est la suivante : 


La distance de deux lois de probabilité L, L', dont les fonctions de 
répartition sont F (x), G(y), est la borne inférieure des ''distances globales! 
de deux nombres aléatoires X, Y dont la fonction de répartition H(x,y) est 
quelconque pourvu qu'elle donne à X, Y, séparément, les fonctions de 
répartition F(x), G(y). 


Marges : 


On peut dire, si l'on veut, que F (x), G(y) sont les ''marges'' du''tableau 
de corrélation! défini par H(x,y). 


Il nous sera précieux d'utiliser le résultat énoncé dans notre Note aux 
C.R. du 14 mai 1956 rappelée ci-dessus, suivant lequel, l'ensemble des 
fonctions H(x,y) n'est autre que celui des fonctions de répartition compri- 
ses (extremités incluses) entre les fonctions de répartition H,(x,y) et 
H, (x, y), (H<H,), définies par 


Ho(x, y) = Sup. [CF Go) +G(y)-1), ol 
Hi (x,y) = Inf. [F(x), G(y)]. 


Observons que dans cette première définition intervient une distance 
globale de X et de Y qui peut s'interpréter de différentes façons. Nous en 
avons donné un premier exemple p. 2 et un second en Note (1), p. 2. 
Autre exemple : pour obtenir une distance globale de X et Y, soit : 


MES PARTIE 
qui tende vers zéro quand X tend vers Y en probabilité et réciproquement, 


nous avons proposé de prendre pour cette distance la borne inférieure 
quand le nombre positif & varie, de la somme 


£ + Prob. (LE 2 Y|=—:) 


On peut aussi prendre pour distance globale de X et de Y, la valeur 
moyenne de f ( | X-- Y| ) où f est une fonction continue, croissante bornée, 
définie pour x>>0, nulle pour x = 0 et telle que f(a+b)<f(a) + f(b) (On 
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peut d'ailleurs se contenter de conditions un peu plus générales; voir 2° et 
3° parties de mon article paru en 1957 dans le Giornale Italiane Attuari). 


>. 6 - 
lt slt te ||) 


J'ai donné comme exemples de f(x) les fonctions 


Les conditions d'existence d'une distance : 
ES) CCR RITEREMERENICRE MOEUE RSS MERCURE 


Pour sa première définition de la distance de deux lois L, L', Lévy 
montre que cette distance satisfait à la condition 3° ci-dessus p. 2. Il est 
évident que la condition 1° est satisfaite, La question est moins simple 


pour la condition 2°, 


Il est clair cependant que si deux lois L, L' sont identiques, l'un des 
couples X, Y satisfaisant respectivement à ces deux lois sera le couple X, 
X dont la distance est nulle, La borne inférieure des distances ([x]: [7] ) 
sera donc nulle et (L,L') sera ainsi nul. Le point le plus délicat est la 
proposition inverse, Quand (L,L') = 0, L, L' sont-elles nécessairement 
identiques 7? 


Précisons par la notation es ARAbx le fait qu'il s'agit de la distance 
globale de X et Y quand la fonction de répartition de leur couple est H(x,y). 


Dans le cas où cette distance atteint sa borne inférieure (L,L') pour 
au moins une fonction H particulière, soit K(x,y}), alors, par définition de 
CES 3 Ba si cette quantité est nulle, X et Y sont non distincts (ou bien 
identiques dans toute épreuve ou bien ‘'presque certainement'' égaux) et 
alors F(x) = G(y), c'est-à-dire Læ L'. Mais si la borne inférieuren'est 
pas atteinte, le raisonnement est moins simple. 


Dire que (L,L') =0, c'est dire qu'il existe pour tout n entier, un 


couple X», Y admissible (c'est-à-dire tel que X,, Yh aient pour lois res- 
pectives L, L') pour lequel la distance : 


(1) GEI se , 


Mais on n'a pas prescrit d'avance le choix adopté pour cette dernière 
distance. Et nous avons montré qu'on peut en concevoir beaucoup qui véri- 
fient les conditions 1°, 2°, 3° ci-dessus et qui soient conformes à notre 
intuition, 


Par exemple, nous avons montré qu'on peut définir des distances 
( [x] , [x] ) très différentes ayant la propriété commune suivante : 


La condition nécessaire et suffisante pour que : 


Lim ( [x]  [X] )=0 


N — 00 


est que X, converge ‘'en probabilité!" vers X quand n æco , 


(1) Voir pour ces deux définitions, les p. 205 et 226 de la 2€ Edition de mes 
l'Recherches théoriques modernes, sur le Calcul des Probabilités'', Gauthier-Villars : 


(1950). 
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Adoptons une telle définition dans l'énoncé de la définition de la dis- 
tance de deux lois L, L'. 


Partons de (1),on a, pour tout r => 0 : 
(2) G(x-E) = Prob. Es <x-e]< Prob [Xn <x|] + Prob|| > AR fr € ] 
F(x) + Prob. KW 'Xn nl =). 


Pour les différentes définitions que nous avons données d'une distance 
de deux nombres aléatoires, compatible avec la convergence en probabi- 
lité, on a aussi : 


(3) CRT TERRE T7 "0). 
Par suite,d'après (1)et (3), on a : 


1 


(Cr - M]: 0) <—+ 


donc Xn- Yn converge vers zéro en probabilité c'est-à-dire que : 


(4) 0 = Lim Prob. ([X1-Y.|—e) 
n —0c0 


pour toute 0. Alors d'après (2), en faisant croître n vers l'infini, on a : 


G(x-Ee)æ=F(x) pourtout & — 0. 


s 


Et comme G(x) est continu à gauche : 
G(x) =F(x). 
Mais on verrait de même que : 
F(x) = G(x) ; 
donc : F(x) = G(x). 


Ainsi, s'il n'était pas évident que la condition 2° soit satisfaite, cela 
est maintenant démontré, au moins quand la définition de (L,L!') est appli- 
quée dans le cas où la distance de deux nombres aléatoires satisfait aux 
conditions ci-dessus. 


Cas où [x] Esp était égal à l'écart quadratique moyen de X et Y. 


Dans la suite, nous prendrons d'abord comme distance globale de 
deux nombres aléatoires X et Y, leur écart quadratique moyen 


VX - YŸ. 


(Pour préciser, nous écrirons %, pour rappeler qu'il s'agit de la moyenne 
quand la fonction de répartition du couple (X,Y) est H(x,y) ). 


Alors la distance À des lois de probabilité L, L' caractérisées par 
les fonctions de répartition F(x) et G(y) pourra être représentée par la 
formule : 


2 
AE ne CA) 
H 
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Observons qu'on a : $ 
2 2 
(X-Y) = 2(X/+%/) d'où : M, (X-Y) <2Z76,X +2JMuY : 


Donc si 96, (X- YŸ est infini, l'une au moins des quantités : 


+00 +00 
n x'dF(x) = 64 x° . y dG(y) a Ve est infinie. 
—œ 


-09 

Pour éviter des complications, nous supposerons que F(x)et G(x) 

* sont les fonctions de répartition de nombres aléatoires ayant chacun un 

écart quadratique moyen fini, Alors %, (X- y} sera nécessairement fini. 

De plus,X et Y pris séparément, ont,sous la même hypothèse, des moyen- 
nes finies et déterminées : 


a = 26 X ; a! =JCY ; 
soient aussio ,o !, leurs écarts quadratiques moyens, Alors, 


X-a Ya) 
Z NE nd T = 

seront les nombres aléatoires réduits correspondant à X et Y. C'est-à- 

dire que les moyennes de Z et T sont nulles et leurs écarts quadratiques 

moyens égaux à l'unité. On aura : 


JE (X - YŸ =2%6 (a-a'+o Z-0o tT) 
= (a ÿ +2(a-a')(cMZ-o ‘'MT)+o23% love M ZT+o' MT? 
qui, d'après ce qui précède, se réduit à 
(a-a)+o? - 200 tr +0" (1) 


en désignant, quand ç & ‘“#0,par r le coefficient de corrélation (linéaire) 
de X et de Y. On sait que [r|< 1. On peut donc poser r = Cos6 , d'où 


(5) 'ORTXE RIRE (a-a')} +(97- 2! cos 0 +a ). 


Cette quantité peut donc être décrite comme l'hypoténuse d'un triangle 
rectangle, dont un côté a pour longueur l'écart |a - a'| entre les moyen- 
nes de X et de Y et dont l'autre côté est le troisième côté d'un triangle 
dont deux côtés ont pour longueurs © et © ‘l'angle compris entre ces deux 
côtés étant égal à 6 (ou encore le cosinus de cet angle étant égal au coeffi- 
cient de corrélation (linéaire) de X et de Y). 


On observera que,dans l'espression (5),a, a',o , © ‘ sont déterminés 
connaissant F et G et c'est seulement r = cos@ qui dépend de H(x,y). Le 
minimum de X6, (X-Y}? aura donc lieu quand r = cos@ sera le plus grand 
possible, Plus précisément la distance entre les deux lois de probabilités 


est donc : 
(L,L')= \ (a-a'} +(0° - 2 To'p +0) 


(1) Cette expression a été donnée déjà dans le cas de nombres aléatoires discrets 
par Salvemini dans: "L'indice quadratico di dissomiglianza era distribuzione gaussiane'', 
Atti della XIV Reunione Scientifica, Societa Italiana di Statistica, 1954. 


(6) 
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où p est la borne supérieure du coefficient de corrélation (linéaire) entre 


X et Y, quand la loi de probabilité du couple X, Y varie de façon à laisser 
fixes les lois de probabilité de X et de Y pris séparément. 


Observons d'ailleurs que : 


ve (x-a)(y-a') dH(x,y) 


V[Gæ-aÿ ar] [ fs - a'ÿ ac] 


Posons : h{z,t) = H(a +o z,a'+o't). Alors :r 


d'où : (7) r = ff start, ' 


De sorte que r est aussi le coefficient de corrélation(linéaire) de Z et 
de T et est exprimé par la formule (7) où h(z,t) est une fonction de répar- 
tition dont les marges sont données et identiques à 


= LE PA tztdh(z,t) 


p(z)=F(a to z) q (t)= G(a' + 't) 


Tout le problème est ramené à trouver la borne supérieure de l'ex- 
pression : 


(8) ef] ztdh(z,t) 


quand h est une fonction de répartition dont les nuarges (a (z) et 4 (t) sont 
données, On sait, que r = Cos 8 = + 1 dans le cas où il y a une relation 
fonctionnelle linéaire croissante 


Y=mX+p avec m0, 


entre X et Y. Dans ce cas, on a donc plus simplement 


Dans l'article de 1954 cité en note plus haut, Salvemini avait conjec- 


turé que le minimum de : 
+00 
sf T (x- y} dxdyH(x,y) 


est atteint pour H identique à la fonction H,(x,y) citée plus haut. 


En 1955, Bass a énoncé dans sa note citée plus haut, ce résultat équi- 
valent (d'après la formule (6) ),que le maximum du coefficient de corréla- 
tion (linéaire) est obtenu pour H= H,. Sa démonstration(qu'il a bien voulu 
me communiquer par écrit) suppose que X et Y sont bornées, 
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L'année suivante, dans son article cité . plus haut, Dall'Aglio 
montre que J est minimum pour H = H,, dans l'hypothèse plus générale 


d 
o 


Fe 


O= Lim xF(x)= Lim y? 


X— —00 À RE 


oO 
Il 


Lim xŸ [L s F (x)] = Lim y" [1 - G (»)] 


Pour 0 = 2. 


Il donne même l'expression suivante du minimum M soit : 


(10) = 2 [l'as f'sw{atn-r 60, 0} dx + 
- y 


C9 


+ 2 fax f'Swpfred-c tn, 0} dy . 


Mais on peut donner une expression plus commode de ce minimum 
(qui est égal à À). 


2 à 
On peut arriver de deux façons à cette autre expression de À . Faisons 
le calcul de À dans le cas où F(x), G(y) sont partout continus et ne sont 
constants,l'un ou l'autre, dans aucun intervalle, Alors l'équation : 


F(x) = G(y) 


représente une courbe I' qui est coupée en un point et un seul par toute 
parallèle à l'un des axes et sur laquelle y croît avec x et réciproquement, 
On a H,(x,y) = F(x) au-dessus (vers les y positifs)de I et H,(x,y) = G (y) 
au-dessous der, 


Gonsidérons Une-suite de nombres ... X1.... X:1 Xe, Xi... XL... 
croissent de -œ à ++00o ; les nombres yj correspondants, tels que : 


F(x;) = G(y;j) 


croitront aussi de -c à +00 . La courbe T' sera contenue dans la suiteS de 
rectangles : 


Eye * Li er nie Vial 


Au-dessus de ces rectangles, H,(x,y) = F(x) et au-dessous 
H,(x;y) = G(y). Dès lors, l'intégrale : 


fes du dyHi (x:y) 
B 


étendue à la région B extérieure aux rectangles de S est nulle et on a 


Î] (x - y} d'H,(x,y) = [fe-stén, (x:y) 
00 ©/-00 S 
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i=too  j=+00 
On a donc : 26, (X-Y) Lim NS (x; =} Ÿ Ai; H: 


i=-00 j=-c 
= Hs 0 9) [Hi Gaue )- cu vi) Guy )+ HG Yi] - 
Or H,; (x, sYin)=EF (xis1) = G (Yi) 
Hi Gi, yi) = F(x;i) = G(yi) 


Hifi yi) = G(yi) , His vin) = G(y;) = F(xi) . 
Donc le crochet est égal à : 
F(xisi) - F(x;) 
et par suite : 


LTTR (X- y} = Limÿ \(xi = yi} [F (xis1) - F (i)] ; 


Puisque l'équation 
(11) F(x) = G(y) 
a une solution continue et croissante en y : 


y =ÀA (x), on voit qu'on aura : 
+00 
à = T64,(X - x} -f [x -2x (x) } à F (x) . 
-00 


En tirant, au contraire, de (11) x =p (y) 


on pourrait aussi écrire : 


À = [lin -1J'acm. 


De la même façon, la borne supérieure p de r est déterminée par la 
formule 


op = fl) LP: 6) -a'] ar (of G-a"u (y)-a| dG (y). 


On peut obtenir encore plus facilement ces expressions en observant 
que si la fonction de répartition est H, (x, y), il y a presque certainement 
une relation fonctionnelle entre les deux nombres aléatoires X et Y, à 


savoir : 
Y =XA(X). 


2 2 
Dès lors : TX -Y) = 26 [A (x)- x] 
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(12) 


(Lo) = JR ar dF(x 


En posant W =F(X)=G(Y), X et Y sont deux fonctions continues 
croissantes de W : 


X=L2(W) ; Y = m(W) 


et W a une densité de probabilité constamment égale à 1 sur 0,1.Ona 
alors 


(13) (LE) *- fr dt) m (t)] dt. 


Dans les notations précédentes, 


À = (a'-aŸ +(0° - 20 0"p +o ë) 


400 A +00 
où p -[T ztdh (z;t) 


on aura : p - zv(z) dy (z) 


co 


sit =v(z) est équivalent à 9 (z) = w (t). 


Remarque : 


La formule (10) de Dall'Aglio et les formules (12), (13) résolvent le 
problème posé (en note) par Salvemini dans son article cité plus haut. 


Exemple 


Supposons que X et Y soient telles que leurs variables ''réduites'' Z et 
T aient la même loi de probabilité. Alors, parmi les couples X, Y il y 
aura un couple pour lequel Z = T, Alors, il y a une relation fonctionnelle 
linéaire croissante entre X et Y pour H =H, et on aura encore comme à 
la formule (9). 


(14) 


On à ainsi un résultat particulièrement simple, La formule (14) 
convient, quand, par exemple, les marges ont une distribution dite nor- 
male, Mais elle convient aussi quand les marges vérifient toutes deux la 
lère loi de Laplace, ou sont toutes deux uniformes, etc... 


Elle convient encore, plus généralement, quand X et Y ont une même 
loi réduite de probabilité comportant un écart quadratique moyen fini. 
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Généralisation : 


Dall'Aglio a montré que si l'on prenait 


LE), = Vo ix-vl 


le minimum est, pour s = l atteint pour H= H. 


On voit comme plus haut, p, = que si F(x) et G(y) sont continus et 
croissants, l'on a alors 


aus ff A (x) - xf° dF(x) ou (L,L') |2(*)- m(t)|° dt. 


—00 


UNE QUATRIÈME DÉFINITION DE LA DISTANCE DE DEUX LOIS 
DE PROBABILITÉ 


La première des trois définitions de (L,L') dues à Lévy est très 
séduisante. Car elle explicite d'une façon très simple et très naturelle la 
notion intuitive que nous pouvons avoir de la distance (L,L') de deux lois 
de probabilité L, L'. 


Son plus grand inconvénient, c'est que, variant avec la définition 
adoptée comme point de départ de la distance globale de deux nombres 
aléatoires, elle exigera à chaque fois la détermination préalable du mini- 


mum de cette distance quand varie la corrélation de ces deux nombres. 


Une quatrième définition : 


Nous allons donc proposer une quatrième définition de ( L,L'), pour 
esquiver cette difficulté. Nous ne considérons donc pas notre définition 
comme meilleure mais seulement comme d'application plus immédiate. 
Nous verrons d'ailleurs ensuite que les deux définitions sont équivalentes 
dans un cas étendu. Elles sont probablement équivalentes dans des cas 
plus généraux encore, sinon dans tous les cas. 


Nouvelle définition de (L,L') : 


Prenons encore comme point de départ, l'une des définitions admis- 
sibles , de la distance ‘'globale'', ( [x] ; [y] )H ; de deux nombres aléatoires 
X, Y - déterminés simultanément dans chaque épreuve d'une catégorie 
déterminée, correspondant à la fonction de répartition H(x,y) du couple X,Y. 

Ceci étant, nous prendrons comme nouvelle définition de la distance 
de deux lois L, L' la quantité : 


as) 2,29 = (69: FD 
où X, Y obéissent aux deux lois L, L'. Ainsi nous appelons distance de 2 


lois de probabilité L, L', la valeur que prend une distance "globale" de 
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deux nombres aléatoires X, Y, obéissant séparément aux lois L, L', quand 


la fonction H(x,y) de répartition du couple X, YŸ atteint sa valeur maximum 
H,(x,y) précisée par la formule (2e 

I1 faut maintenant prouver que cette quantité (L,L') est bien 
distance!''; c'est-à-dire satisfait aux trois conditions bien connues, rappe- 
lées pages 1,2,sous lesn°1,2°,3°, On aura ainsi une justification partielle 
a posteriori de la définition que nous venons de poser dogmatiquement. 


lune 


Par hypothèse, pour toute fonction de corrélation H(x,y) admettant 
pour marges les fonctions de répartition F(x), G(y) des lois L, L', la 
distance globale de [X] et [Y] vérifie les conditions : 


(0, Met He 0 


2° ([X] , [Y] hu est positif si X et Y sont ''distincts'' et inversement. 
(On considère, en général, comme non distincts deux nombres aléatoires 
qui sont ‘'presque certainement'' égaux, c'est-à-dire tels que : 


{Prob.(x=Y)}=1. 


C'est aussi la condition nécessaire et suffisante pour que F(x)= G(x). 
Dès lors en appliquant au cas où H =H, 


1° (L de (L,1.) 0 
2(L,L')= 0" s1 L'= L'etinversement. 


En ce qui concerne la condition 3°, nous devons faire intervenir trois lois 
de probabilité L, L', L'', correspondant à trois fonctions de répartition 
F(x), G(y), K(z). Introduisons une corrélation particulière entre trois 
nombres aléatoires X, Y, Z, obéissant respectivement aux trois lois L, 
L', L'', Nous choisissons à cet effet la corrélation définie par la fonction 
de répartition : 


E(x,y,z) = Min [F (x), G(y), H(z)] 3 
On voit bien que si le système X, Y, Z a pour fonction de répartition 


E(x,y,z),X,Y,Z auront bien F(x), G(y), H(z) comme fonctions de répar- 
tition,. Car, par exemple, 


Prob (X x) = Prob (X = x, Y— to, Z—+0) 
= E(x, +00, +0) = Min (F(x),+1,+1)=F(x). 
On aura de plus : 
E(x,y,+00) = Min CF (x), G(y),+1] = H,(x,y) 
et de même les fonctions maximées de répartition de (X,Z) et de (Y,Z) 
seront 
H\(x,z) = E(x, +00, z) 
H' (y,z)= E(to,y,z). 
Ceci étant, on a : 


(16) CET ED, =, 1, = (1, F1) 


X,ÿ3 + 00) ” 


E(x,y,z) 
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Or, par hypothèse, pour n'importe quelle fonction de répartition à 
trois variables, U(x,y,z),ayant les marges données F, G, K ona : 


DC) CA. 
Donc, en prenant en particulier E pour U et utilisant les deux égalités 
analogues à (4),on a : 


D BD, <<. Ely+(01, ED 
c'est-à-dire : 


(DAL') RL Lt) +UL' LS . 


Equivalence : 


Il résulte des démonstrations de Bass et de Dall'Aglio que dans le 
cas où l'on à pris : 


Ex], C1), = Va (x-v} 


et sous les restrictions très générales et qui,d'ailleurs,ne sont peut-être 


pas nécessaires, la valeur de (L,L!') reste la même qu'on emploie la pre- 


mière définition de Paul Lévy ou la nôtre. 
Calcul général de (L,L!') : 


Considérons lecasoùF (x) et G(y) sont des fonctions partout continues 
et croissantes. Alors la courbe T : 


F(x) = G(y) 


va séparer la région R où H, = F (ÆG) de celle, Q,, où H, = G(<F). Si 
l'on pose : 
F(x)=G(y)=t 


on voit comme plus haut que x et y seront des fonctions continues et crois- 
santes de t, soit : 
x =£ (t) vu (E)e 
Quand la fonction de répartition est : H,(x,y) = Min Cr (x), G(x)] ne 


différence seconde de H, sera nulle à l'intérieur de R et à l'intérieur de Q, 
c'est-à-dire que le point (X,Y) est presque certainement sur l',. 


Autrement dit, il y a dans ce cas une relation fonctionnelle presque 
certaine entre X et Y, à savoir : 


F(x) = G(y). 


Le nombre aléatoire T égal à la valeur commune de F et G sur L 
reste entre 0 et 1 avec une densité de probabilité constante et égale à 1. 


11 en résulte l'expression de (L, L') : 


(2,11) =([8(m)] ,[m(T)}). 
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Exemple : 


Par exemple, si l'on part de l'expression : 


A y|” d,d H(x,y) = [/ Mb SA AN 


avec , 


on aura : 


(L,L')*=6|L2(T PACE) [0e , d'où : 


en y = A(x), 


où À (x) sera, comme F et G,une fonction continue crofssante. On pourra 


alors écrire : 
(LE) Ve fix Alx)l « dF(x 
- co 


L’INDICE DE DISSEMBLANCE DE GINI 


Pour deux suites également nombreuses de nombres nondécroissants; 
DRE A ete ee Dh ; bebe. "< b,, 


cet indice est posé égal à 
HÉSTERCT & = l:indice simple 
= — de 
ce 21 h bi] &æ = 2:indice quadratique 


Mais on peut prendre n'importe quel a =1. 


Il 


Les a n'étant pas nécessairement distincts, leurs valeurs distinctes 
sont répétées, r fois,... rn fois. Elles peuvent être considérées comme 
les valeurs prises par une grandeur statistique X dans n épreuves, Les 
valeurs distinctes de X : xjx,—.,,. auront les fréquences : 


r r 


f, =— ; “SR Le suite {rer 


pr for. 


définit ainsi une loi de fréquence L,. De même, la suite des valeurs dis- 
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“ . 2 s 
tinctes Y :Y,.+...prises par les bj avec les fréquences :v, ma Po = To 


définit une loi de fréquence L', 


En permuttant les b,, on obtient une suite bi, b;,... qui n'est plus 
nécessairement non décroissante, Si chaque épreuve associait à un a}; b}; 
on aurait une loi H de fréquence du couple X,Y. En associant b} à a, on a 
une loi particulière, H', de fréquence de ce couple. Nous allons montrer 
que H'= H,, de sorte que l'indice de dissemblance de Gini deviendra iden- 
tique à ce à quoi se réduit notre distance de L et de L' dans le cas parti- 
culier où L, L' sont les lois de deux grandeurs statistiques (ayant chacune 
un nombre fini de valeurs). 


En effet, supposons d'abord : 
a x <a, : bj = y <b, 


alors il y aura un h et un j tels que 

XX << 8h}, ? bj=y<bj: Ft 
On aura 

H'(x,y) = Prob (X=x , Y—Yy)= Prob (X—ah,, Y=b;) 
et puisque H' correspond au cas où b;j est associé à aj, alors si j=h 
H'(x,y) = Prob (Y=bjy) = Prob (Y=y) = G(y) 
et F(x) = Prob (X—ahy)= Prob (Y — bj41) = Prob (ep à 
Donc : si j<h 
H'(x,y) = G(y)< F(x) 
H'(x,y) = Min[F(x), G(y)] = H (x,y) . 


En répétant le même raisonnement pour hæ=j, on voit que dans les 
deux cas : 


(1') H'(x,y) = H,(x,y). 
Dans le cas où xæ<a,, on aurait évidemment : 


H'(x,y) = F(x) = 0<G(y) 


et par suite (l') subsisterait; de même si yZb, raisonnement analogue 
pour x—a, ou y—b,. Ainsi dans tous les cas 


H'(x,y) SH (x,y). (1) 
L'indice simple (x = 1) ou quadratique (a = 2) de dissemblance, 


habilement choisi par Gini, se trouve ainsi être en même temps une 
distance'', de deux lois de fréquence, Plus précisément, il rentre dans 


(1) Nous ne faisons ici que reprendre un peu plus en détail le raisonnement de 
Salvemini qui, du reste, ne s'occupe pas de la notion de distance. 
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la catégorie plus générale de la quatrième définition de la distance de deux 
lois de probabilité absolument quelconques (discrètes ou continues ou 
intermédiaires) précisée p.1l. Il présente, d'autre part, cet intérêt 
d'offrir un mode de calcul plus simple que celui qui résulterait directe- 


ment de la formule : 
œ 
Tue \/x6,] x- x|° 


SUR LA DEFINITION TEMPORELLE 
DES FONCTIONS ALFEATOIRES 


par 


J. BASS 


1 - INTRODUCTION 


Considérons un phénomène naturel auquel on puisse associer une 
grandeur u de caractère scalaire, Ou bien u a une valeur bien déterminée, 
qui reste la même lorsqu'on fait une série de mesures successives compa- 
rables, u est alors une constante physique . Ou bien les valeurs de u chan- 
gent d'une mesure à l'autre, S'il est possible d'organiser une succession 
continue de mesures de u en fonction du temps t, u devient une fonction 
continue de t, définie pour t >0, et représentée par une courbe continue TL, 
Deux cas se présentent alors, Dans le premier cas, la courbe I' a une 
apparence simple, et, lorsqu'on recommence l'enregistrement dans les 
mêmes conditions, on obtient, aux erreurs d'expérience près, la même 
‘courbe, J' caractérise alors la loi d'un phénomène macroscopique évolutif. 
Dans le second cas au contraire, L' présente un aspect compliqué. La 
valeur de u(t) pour un instant t choisi ne semble pas avoir de signification 
en soi, et deux expériences successives fournissent deux courbes non 
superposables. Il n'en résulte d'ailleurs pas que le phénomène étudié ne 
soit pas soumis à des lois précises. Il peut même arriver que, évolutif 
dans le détail, il soit en réalité permanent dans son ensemble, Mais il 
est bien connu que son étude est simplifiée par l'emploi des méthodes 
statistiques. Si u(t) estune fonction plus ou moins périodique et irrégulière 
de t, des valeurs moyennes telles que 


T T T 
1 1 1 
1 fata , & futæ ; £ fiouesn dt 


présentent, d'une expérience à une autre, un caractère de permanence 
très remarquable, pourvu que T soit suffisamment grand. 


Un exemple de phénomènes de ce genre est fourni par la turbulence. 
u(t) est une des composantes de la vitesse en un point fixé par rapport 
auquel s'écoule un fluide. Si l'écoulement est permanent, au sens habituel 
de ce mot en mécanique des fluides, la mesure grossière de u(t) fournit 
une valeur constante, appelée vitesse moyenne, ou vitesse d'ensemble, ou 
même vitesse tout court du fluide, Mais un enregistrement plus fin conduit 
à une représentation essentiellement fluctuante, caractéristique du phéno- 
mène de turbulence, et à laquelle il est aujourd'hui classique d'appliquer 
les méthodes statistiques, ou plutôt probabilistes, 
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Si les données macroscopiques sont maintenues constantes d'une expé- 
rience à la suivante, il semble intuitif que les grandeurs moyennes conte- 
nues dans la courbe I conservent les mêmes valeurs. Il résulte de cette 
remarque qu'un seul enregistrement, prolongé sur une durée suffisamment 
longue, permet de calculer ou de mesurer toutes les moyennes intéres- 
santes. Or, si l'on associe à la fonction u(t) diverses moyennes, on est 
tout de suite conduit à traiter u(t) comme une fonction aléatoire du temps, 
stationnaire puisqu'elle représente un phénomène permanent. La question 
se pose donc de savoir de quelle façon une seule épreuve sur une fonction 
aléatoire stationnaire permet de définir cette fonction. 


La réponse à cette question est fournie d'une façon générale par les 
théorèmes ergodiques, et leur application à la turbulence a fait l'objet 
d'un grand nombre de travaux récents (1). Mais il semble que certains 
aspects pratiques de ce problème n'aient pas toujours été suffisamment 
mis en évidence, Ce sont ces aspects que je me propose d'examiner ici, 


2 - LOIS DE PROBABILITÉ A UNE VARIABLE 


Si u(t) est bornée et continue, toutes les intégrales 


1 
+ fe dt 


existent, et peuvent se rassembler dans une unique fonction 


T 
(251) g (z) + Jane 
0 


(a (z), moyenne de fonctions caractéristiques, est la fonction caracté- 
ristique, au sens du calcul des probabilités,d'une variable aléatoire U. 
Cette remarque a été souvent faite, La fonction de répartition F(u) de U 
se calcule de la façon suivante : 


T F(u) est la mesure (au sens de Lebesgue) de l'ensemble des valeurs 
de t pour lesquelles u(t)<u, 0tT, Le résultat peut d'ailleurs être 
étendu à la fonction 


(2,2) lim = eizu(t) dt, 


moyennant certaines restrictions (2). Je reviendrai plus loin sur ce point. 
Si par exemple u(t) = sint, F(u) admet une densité qui est exactement 
égale à EU 21 
= i u| <1 
UE Pme sl 


* 0 si u>1, 


(1) Cf. J. Kampé de Fériet, dans A, Blanc-Lapierre et R. Fortet, théorie des 
fonctions aléatoires, Masson, 1953, page 579, 


(2) CF. en particulier C.R. Putnam, Journal of the society for industrial and applied 
math, 3, 1955; pagerl 3 
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pourvu que T soit un multiple de 2x, et qui tend vers la fonction ci-dessus 
lorsque T — co . 


Mais un tel résultat ne permet pas d'affirmer que, à u(t), on ait atta- 
ché une fonction aléatoire. On à seulement défini une fonction de réparti- 
tion, ce qui est tout différent. Or, les grandeurs qui intéressent le physi- 
cien ne sont pas seulement les moyennes de u(t), mais aussi certaines 
moyennes plus compliquées telles que la fonction d'autocorrélation 


“fl 
+ fo u(t+h) dt 
0 


pour diverses valeurs de h=0. De telles fonctions doivent être rattachées 
aux lois de probabilités de la fonction aléatoire considérée en deux ou plu- 
sieurs instants distincts. Onest ainsi conduit à examiner si la connaissance 
d'une seule épreuve portant sur u(t) entraîne celle des lois temporelles 
de u(t) (1), Que ces lois temporelles suffisent à définir u(t) en tant que 
fonction aléatoire, cela est plus difficile à prouver, et je n'aborderai pas 
ici ce problème, qui est d'une importance moins immédiate pour le physi- 
cien, 


En pratique, le problème des lois de probabilité à plusieurs variables 
se pose d'ailleurs d'une façon un peu plus générale. Par exemple, dans le 
cas de la turbulence, u(t) dépend de l'espace, et il est intéressant de faire 
la comparaison statistique des valeurs de u(t) au même instant t, mais en 
plusieurs points. Si u(t) et v(t) désignent deux composantes de la vitesse 
en deux points, on se pose la question suivante : la fonction 


L 
(2.3) o (2 PE em 
0 


est-elle une fonction caractéristique, et quelles sont ses propriétés ? 


Au lieu de deux fonctions ut) et v(t), il est naturellement possible 
d'étudier un système de n fonctions u(t)},..., un(t) auxquelles on se pro- 
pose d'associer une loi de probabilité à n dimensions, Pour simplifier, je 
me limiterai dans la suite à n = 2. 


Je me propose donc d'examiner les propriétés de (2, 529 ), considé- 
rée comme une fonction caractéristique, d'abord lorsque T est fini, puis 
lorsque Too , 


3 - LOIS DE PROBABILITÉ À DEUX VARIABLES 


Il est presque évident que (z 29 ), définie par (2.3), est la fonction 
caractéristique d'un couple (U,V) de variables aléatoires. Mais ces deux 
variables aléatoires ne sont pas quelconques. Si l'on se donne la valeur de 
U, cette valeur est prise par la fonction u(t) en un certain nombre d'ins- 


(1) Au sens de A, Blanc-Lapierre et R. Fortet, Théorie des fonctions aléatoires, 
Masson, 1953, 
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tants t auxquels correspondent des valeurs v(t) bien déterminées de V. 
En d'autres termes, le point de coordonnées aléatoires U, V décrit,en 
fonction de t, la courbe C qui a pour équations paramétriques 


(3771) g = ut), n =v(t) , O<t<T 


On peut donc dire qu'on n'obtient pas une véritable loi de probabilité à 
deux variables. Toute la probabilité est rassemblée sur une courbe C 
intérieure au rectangleR qui est défini par les inégalités 


[£|<max,lu(t)|, In|l< max.lv(t)l 


Cependant cette conclusion n'est pas très précise. Si l'on suppose 
seulement que les fonctions u(t) etw(t) sont continues, elles peuvent être 
fort compliquées. Elles peuvent par exemple ne jamais être dérivables, 
ou ne pas être à variation bornée, auquel cas la courbe C n'est pas recti- 
fiable, Il est bien clair que de telles circonstances ne correspondent pas à 
la réalité. L'expérience fournit des courbes dont la tangente existe et varie 
d'une façon continue. On peut cependant se demander si, pour donner une 
représentation mathématique de courbes expérimentales compliquées, il 
n'y aurait pas intérêt à renoncer à certaines propriétés de régularité, qui 
sont peut être davantage l'image des instruments de mesure que celle du 
phénomène étudié proprement dit, et à introduire des fonctions d'un type 
mathématique moins élémentaire. 


On sait par exemple qu'il est possible de choisir des fonctions conti- 
nues ut), w(t), définies sur un intervalle fini 0<tT, telles que la 
courbe C passe par chaque point du rectangle À . Peano et Hilbert ont donné 
des exemples simples de telles courbes. Contrairement aux courbes 
rectifiables, ces courbes ont une mesure superficielle positive et non 
nulle. La fonction de répartition du couple aléatoire (U,V) associé aux 
fonctions u(t) et v(t) est le quotient par T de la mesure linéaire de l'en- 
semble des valeurs de t pour lesquelles 


u(t) <U v(t)= V 


Que tout rectangle R' intérieur au rectangle À contienne des points de 
la courbe C, cela veut dire qu'il y a des valeurs de t, de mesure positive, 
pour lesquelles le point u(t), v(t) est intérieur à À' et par conséquent que 
R' contient une probabilité positive ; la probabilité est donc distribuée en 
réalité dans un ensemble de mesure superficielle non nulle, Elle n'a plus 
le caractère de dégénérescence qui l'avait fait rejeter comme inadéquate, 
Elle n'est plus distribuée sur une ''courbe'', au sens courant du mot courbe, 


Il semble cependant que la représentation mathématique de u(t) et v(t) 
par des fonctions de cette nature soit trop compliquée pour fournir une 
image raisonnable des courbes expérimentales. Mais il existe un autre 
moyen plus simple et plus naturel pour extraire de u(t) et v(t) une véri- 
table loi de probabilité. I1 suffit de supposer que T est très grand, et, du 
point de vue mathématique, de poser 

= 


(3.2) x (z; , 25) = Jim + e [Zu (E)+2, VD] dt 
0 
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Il peut alors arriver que la courbe C, sans passer par tous les points 
du rectangle R, passe, pour des valeurs de t convenables, aussi près qu'on 
le veut de chaque point de ce rectangle. On dit qu'elle a pour fermeture le 
rectangle, où encore qu'elle est dense dans le rectangle, 


s 


La probabilité pour que le point ($,n) appartienne à un rectangle @'! 
contenu dans À n'est positive que siR' est traversé par C. SiC est dense 
dans R, il y aura dans tout rectangle R' une probabilité positive, et la loi 
de probabilité associée à (Z: , Z:) échappera au caractère de dégénéres- 
cence qu'elle avait lorsque T était borné. 


L'existence d'une fonctionw (z, , z:) 1éfinie par (3.2) a été reconnue 
par B. Jessen et A. Wintner (1) qui ont énoncé le théorème suivant : 


Si u(t) et v(t) sont deux fonctions presque périodiques continues, 


u 
AIO VOIE" 
(0) 


est une fonction caractéristique. L'ensemble des points (7) du plan tels 


que tout rectangle contienne une probabilité positive est la fermeture de la 
courbe 


Ë = ut) n = v(t) 
pour t 0. 


Ce théorème justifie donc la représentation statistique des fonctions 
u(t) et v(t). Il montre en particulier que, si l'on se donne convenablement 
la seule fonction u (t), la quantité 


T 
lim L / eilautt)+Z u(t+b)] & 
1 D 


est la fonction caractéristique d'un couple de variables aléatoires n'ayant 
entre elles aucune dépendance fonctionnelle, au sens habituellement donné 
à cette expression. Il semble d'ailleurs que, jusqu'à un certain point, les 
courbes expérimentales s'accordent d'une façon satisfaisante avec la 
représentation de u(t) et v(t) par des fonctions presque périodiques conti- 
nues. Je vais admettre qu'il en est bien ainsi. La question qui se pose 
maintenant est donc la suivante : 


u(t) et vit) étant des fonctions presque périodiques continues, sous 
quelles conditions la courbe 


(C)  £ =u(t) n = v(t) 


est-elle dense dans un domaine D d'aire positive du plan (2) ? 


(1) Trans. amer, math, soc., 38, 1935. 


(2) Dans un travail antérieur (Les Méthodes modernes du calcul des probabilités, 
et leur application au problème de la turbulence, 1947), je n'avais pas suffisamment tenu 
compte de cette éventualité, et j'avais conclu que le coefficient de corrélation, introduit 
dans la théorie de la turbulence par sir G. I. Taylor, n'avait aucune signification statis- 
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4 - ÉTUDE DE LA COURBE E = u (t), 9 = v.(t) 


u(t) et v(t) sont par hypothèse deux fonctions presque périodiques 
continues. Il est bien évident que, par exemple, la courbe 


É. = cost», n =cos2t 


n'est pas dense dans le carré [£[ < 1, [n|<1, ni dans aucun domaine D 
intérieur à ce carré. C'est en effet un arc de la parabole 


ne ci 
LE) 


Au contraire, un raisonnement élémentaire montre que, si —* est 
rÀ 
irrationnel, la courbe 


£ =sinnt n =sinà,t 
est dense dans le carré ci-dessus. 
L'étude du cas général résultera facilement de celle du cas oùf etn 


sont deux polynômes trigonométriques à un nombre fini n de termes, de la 
forme 


£ . aj sin (Ait +v:i) 

(4°1) L 
=>, bi sin (Ait +pi) 

i={ 


ai, bij, Ài, Vi sont 4n constantes données. ai, b;, i peuvent être nuls, 
mais ondoit naturellement supposer que a; et bij ne sont pas simultanément 
nuls pour une même valeur de Aj. Certains des Àj peuvent être égaux. Si 
par exemple £ contient le terme a sinAt etn le terme b coskit, on peut 
écrire les termes correspondant à À sous la forme 


a sin (nat +®) + a'sin (At +4!) 
b sin (At +v) + b'sin (At +") 


= Cu be = 
avec (a © a. 9 > ; a Oasis b'=10 


Considérons d'abord,dans un espace E, à n dimensions, la courbeŸ 
qui a pour équations 


(4.2) xj = sin (Ait +6i) Ve US Grosso 


Cherchons si, dans E,, la courbe Ÿ peut passer arbitrairement près 
d'un point donné xj. Dire que sin (Ait +yi) est voisin de x',c'est aussi dire 


tique. Cette conclusion n'était pas exacte. Indépendamment de l'interprétation spectrale 
de la fonction de corrélation, on va voir que l'existence de certains types de relations 
fonctionnelles entre deux variables aléatoires U et V n'est pas incompatible avec l'usage 
statistique du coefficient de corrélation, c'est-à-dire avec l'existence pratique d'une 
véritable liaison stochastique entre U ét V. 


On doit noter d'ailleurs que la représentation de la turbulence par des fonctions 
presque périodiques, dont l'aspect local peut sembler très satisfaisant, risque de ne pas 
être tout à fait correcte car elle ne correspond pas à la forme à l'infini des fonctions de 
corrélation fournies par l'expérience, Cf.sur ce point J.Bass,C.R.Ac.Sc., 245, 1957, p.1217 
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: : T : Re 
que, si; est l'arc compris entre - Set Ttel que sinaj = x, les quantités 


Ait +; sont arbitrairement voisines dej, à un multiple de 27 près. On 
demande donc s'il existe un nombre t positif et des entiers k; tels que 


Fait + vi -a; +2rk; | = € 
c'est-à-dire plus simplement s'il existe un nombre t positif tel que 
(4.3) Fait +gi- œil = É (mod 2z) 


Or la réponse à cette question est donnée par un théorème de 
Kronecker (1) : 


S'il existe entre les À; p relations linéaires à coefficients entiers, de 
la forme 


(4.4) SEMAINE "0 
il existe une solution t des inégalités (4.3) pour tout point «ji tel que 
(4.5) D m; (oi -a«;)}=0 (mod 2x) 


Pour mieux comprendre ce théorème, examinons d'abord un exemple. 
Supposons que la courbe initiale C ait pour équations 
8 =sint +sinxrt 
(4.6) 


y = cos t 


On peut écrire 


€ = sint+a sin(t+5) + sinnt 


x 
sin (t+ 3) 


ñ 


avec a = 0. On doit associer à C la courbe Ÿ définie par 


(4.7) 1 SION x? = sin(t F xX3 = sinnt 
avec 
7 = | pi nm 
LS _ 
hs fe a a 


Entre les Xi existe la relation À, = À. La courbe Ü passe au voisinage 
de tout point x'j tel que 


CUT EC ou sin & = COS d, 


c'est-à-dire 


x=# Vl-x2 ou XF = | 


(1) Cf. Favard, Leçons sur les fonctions presque périodiques, Gauthier-Villars, 
1933. Consulter aussi les Leçons sur la théorie des nombres, de A, Châtelet (Gauthier- 
Villars, 1913), à propos des modules de nombres entiers. 
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Ce résultat, qui pourrait se prévoir plus élémentairement, exprime 
que, dans E;, la courbe Ÿ est tracée sur un cylindre de révolution d'axe 
0x3. Sa projection sur le plan des x, x; par exemple est dense dans le 
carré | x,|[< 1, | xs 1. La courbe # est donc dense sur la portion de ce 
cylindre comprise entre les cotes -1 et 1. Elle n'est pas dense dans le 
cube | xi| <1, 


Revenons au cas général. Dans l'espace des «;j,ies p relations (4.5) 
représentent un système de variétés linéaires à n - p dimensions, dont 
TT 
& 
des x!, il leur correspond une variété algébrique à n -p dimensions. Cette 
variété est décomposée en nappes sur chacune desquelles la courbe Ÿ est 
dense. Aux points (x;) d'une V deces nappes, faisons correspondre le point 


seules sont utiles les parties intérieures au cube |a; [= Dans l'espace 


E ED ai x; 


m ob 


i=i 


(4.8) 


A ec... An 
Si la matrice 
bananes 


est de rang 2, à tout point x; de l'espace E, correspond un point En), et 
réciproquement, à tout point (€ 1) correspond au moins un point de l'es- 
pace. Faisons alors un changement de coordonnées où £ etn soient les 
deux premières coordonnées. Désignons par Masai nd les n - 2 autres, 
fonctions linéaires des xj. A la variété V correspond une variété V' dans 
le nouvel espace. On s'intéresse à la projection d'un point de V' sur le 
plan des£ ,n. 


En général cette projection remplit un certain domaine D d'aire posi- 
tive. Il en résulte que, en général, la courbe C est dense dans D. Il peut 
cependant arriver que la variété V' appartienne à un hypercylindre algé- 
brique projetant sur le plan des£ ;,n. Dans ce cas, les points de V' se 
projettent suivant une courbe algébrique, qui n'est pas dense dans le plan 


des£ ,n. 


Si donc il se trouve que, entre$ etn, il existe une relation algébrique 
qui soit conséquence algébrique des relations existant entre les xi, la 
courbe C n'est pas dense dans un domaine du plan des* sn + Dans tout 
autre cas elle est dense, 


Voici un exemple de circonstance exceptionnelle. Supposons que C ait 
pour équation 


É 
n 


sin t+sinrt 


Hi 


(4.9) 


cos 2t +cos 2nt - 2 cos{fn-1l)t+2cos{fn+l)t 
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Posons 
X, = Sin t X2 = SinTt X3=Ccos 2t X, = COS 2Trt 
(4.10) xs = cos (t-1)t x$= cos fn +l)t 
de sorte que 
É = x + x2 


u Z Xi MXGN2 KE + 2°Xe 


Entre les 6 coordonnées, il existe les relations algébriques suivantes : 
À EpavPer tale 0 Bexih2æs-8l = 0 
(4.11) (xs - x 22) = (1 - x )(1 - 2) 
CAS VIRE TARA SR CAPOT 2 PP où D=x fx tx-2x x xs L=0 
Or on voit quen +2 £° - 2 est une combinaison algébrique des 4 poly- 
nômes A, B, C, D, qui sont nuls sur la courbeëË de E,. On a en effet 
n +2E 02.2 Act+-.B + 2 C 
Par suite, la courbe C décrite par le point (£:n) est un arc de parabole. 


Elle n'est pas dense dans le plan. 


Si les À; ne sont liés par aucune relation linéaire à coefficients cons- 
tants, ce qui implique en particulier que deux Àij correspondant à deux pi 
distincts soient eux-mêmes différents, la courbeŸË est dense dans le cube 
|xil  l'entier, et C est dense dans le domaine polygonal déduit de ce 
cube par la transformation 


(4.12) LD air %; nDSb;ex; 
Par exemple, la courbe (c) : 


Ë 
Li 


est dense dans le domaine déduit du cube à 3 dimensions par la transfor- 


mation 


sint + sin V2t 


(4.13) 


il 


sinxt 


(4.14) Ë = x + x n = Xs 
c'est-à-dire dans le rectangle 
Fe e In | <1 (Fig. 1) 


Voici enfin un exemple de courbe C dense dans un domaine du plan des 
(£,n); bien que la courbe ne soit pas dense dans le cube | xi| = I RE TRE 
La courbe 


É =sint + sinrt 
n =cost 
résulte par la transformation (4.14)de la courbe Ÿ qui a pour équations 


x, = sin t X, = Sins t X3 = COS t 


208 J. BASS 


Cette courbe est dense sur la partie du cylindre de révolution xt xs 1 
comprise entre les plans x»=* 1. La courbe est donc dense dans le domaine 
du plan des£ ,n obtenu en projetant les points du cylindre parallèlement à 
la direction (1, 0, -1). Ce domaine est constitué par les points intérieurs 
au carré ale | 4, In | 1, complété par l'intérieur de deux demi-cercles 
facilestà placer (fig. 2). 


Remarquons encore que le domaine D,, n'est pas forcément un domaine 
convexe, ni même simplement connexe. Si l'on considère par exemple la 
courbe 
€ =sint-asinxrt 
(4.15) 

NAEICOSRE 
sa fermeture se déduit des points du cylindre ci-dessus par une projection 


parallèle à la direction 1, 0, > Si a 1, le domaine D est alors double - 


ment connexe (fig. 3). 


LIL 


5 - FIN DE L’ÉTUDE DE LA COURBE £ = u (t), N = vw (t) - 
CONCLUSION 


Il reste enfin à examiner le cas où£ etn sont définies par des séries 
presque périodiques ayant un nombre infini de termes 


09 


€ DE a; sin (Ait +wi) 
n:1 


(51) = 
1 "2; b; sin (Ait +) 


On supposera que les séries > ja, | et> [bn | sont convergentes, de 
telle sorte queË etn soient des fonctions continues de t. On peut alors 
trouver un rang N tel que, si n=N, les restes des deux séries données 


c : 2 ee Ë 
soient uniformément inférieurs à. Supposons alors que la courbe 


N 


& => aj sin (Ajt +q) 
(5.2) F 


71 3 bi sin (Ait +pi) 
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soit dense dans un certain domaine D. Nous savons reconnaître s'il en est 
bien ainsi. Etant donné un point (8 5n') du plan, on peut trouver une valeur 
de t telle que 


[s-81<£ fun | <+ 

Or 
[e- sg l< [r- | +|x- #|<e 
REP LE TS PS UE 


Le point (£,n) correspondant à la valeur trouvée de t s'écarte donc de 
moins de £ du point choisi. La courbe C est donc dense dans C. 


On voit en définitive que, suivant les circonstances, la courbe C défi- 
nie par les équations (5.1) peut avoir une structure très variable, Mais, 
d'après ce qui précède, on sait reconnaître si cette courbe est dense dans 
un domaine d'aire positive du plan, Ce domaine peut d'ailleurs ne pas être 
simplement connexe. 


Du point de vue pratique, les courbes fournies par l'expérience ne 
sont pas assez précises pour qu'on puisse leur appliquer rigoureusement 
les résultats théoriques .Mais on peutdire que, dans des cas aussi compli- 
qués que celui de la vitesse d'un fluide turbulent, les conditions pratiques 
pour que la courbe C soit dense dans un domaine (en général simplement 
connexe) sont vérifiées. 


La théorie nous autorise donc à utiliser les résultats d'un enregistre- 
ment unique pour associer au phénomène correspondant une loi de probabi- 
lité à deux variables, pourvu que l'enregistrement soit de durée suffisam- 
ment longue. Cela veut dire que cette durée doit être grande par rapport 
aux plus grandes périodes des harmoniques en jeu. Si cette condition 
n'était pas réalisée, certaines anomalies, peu sensibles dans le cas de 
lois à une variable, risqueraient de se manifester dès qu'on passerait aux 
lois à deux variables, 


En physique mathématique, on rencontre souvent des équations aux 
dérivées partielles qui admettent pour solution des fonctions presque 
périodiques par rapport au temps. Cette simple circonstance rend alors 
possible d'appliquer à ces solutions les méthodes statistiques. Elle se 
présente fréquemment lorsque les équations sont linéaires, l'ensemble 
des valeurs des À, constituant le spectre d'un certain opérateur linéaire. 
Mais elle n'est pas incompatible avec la nature des solutions d'équations 
non linéaires. Pour terminer, nous allons étudier certaines solutions 
presque périodiques d'une équation non linéaire voisine des équations de 
l'hydrodynamique. 


6 - APPLICATION A UNE ÉQUATION AUX DÉRIVÉES PARTIELLES 


L'équation 


1 
(6-1) a 7 
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a été proposée et exploitée à plusieurs reprises par J.M. Burgers (1) 
comme modèle simplifié des équations de l'hydrodynamique des fluides 
visqueux, Elle est en effet du second ordre et son premier membre, non 
linéaire, a bien la forme du premier membre des équations de l'hydrody- 
namique (avec une seule dimension). Je me propose ici, non pasd'en 
rechercher a priori des solutions aléatoires, mais seulement d'en former 
des solutions périodiques ou presque périodiques, qui soient une image 
acceptable d'un écoulement turbulent schématisé. (avec les réserves de la 
note, p.204). 

1 à log Z ramène l'équation (6.1) à 


On sait que la transformation u = ' Fee 
l'équation de la chaleur 
DAME 
(6:2) OVE A VAN 


L'équation (6.2) admet des solutions exponentielles de la forme 
entr) Era 


où À est un nombre réel positif. Elle admet par suite des solutions pério- 
diques ou presque périodiques, de la forme 


P MODESTE 


(633) 2 = 1-5, e 


k=1 


Il en résulte que, si SE [Au | “1, la fonction 
k=1 
p 


D on à PURE 
KO 
(6.4) u=-(1+#i) 
P 
=(H+IJAg x+iN,2 E 
> A, © k k 
k=1 F 


est une solution particulière de (6.1), C'est en général une fonction conti- 
nue presque périodique du temps. Si x est non négatif, on peut représenter 
u par une série d'exponentielles, On trouve 


(6.5) u=- cHEe rue (En) Aer Re ë HE Mon RË Aie 
+. pl 


&: «ph étant des entiers qui prennent toutes les valeurs à partir de 1. 


Par rapport au temps, u apparaît bien comme une fonction presque 
périodique dont toutes les pulsations sont de la forme 


2 ; 
Pr LUC LE entier 
k=1 


(1) Cf. en particulier la référence suivante (où sont rappelées diverses références 
antérieures) : Proc. Koninklijke Nederlandse Akad, van Wettenschappen B, vol. LVII. 
n° 2, 1954. 


PT PE SN EN VE CN EN TS 


RD Se À SE Sd "Li 


_ dsl 
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Elles sppertiennent à un moûsle entier, u est une “fonction quasi 
périodique" 24 sens d'Esclangon, Bi p = 1, u eet une fonction périodique : 


2 
(6,6) “= -(1 +553 Bel )nanñrat 
æ1 


Si ps Z, on trouve 


a! £! 


(6,7) “= HAE 5 as 2 D 0e snif )s66ia 28 )t 


Gi l'en rerplase Les sommes finies par des séries (p infini), les 
ra 

résuliais ce gémhrsisent ziséroent, à condition que la série > ; 12, | ait 
pr] 


as some fnesienre à |, 0, quotient de deux fonctions presque périodi- 
et conne, ct, cas Les conûffions infiaquées, une fonction presque 
Périoéious, nil ec possile 2 Ébyelopper en série de Fourier, On peut 
cepenésié serrer Que, Éens Le ç28 simple de 12 formule (6,7), l’en- 
+202 Ê24% puiestions À, “ +28 set dense sur Le ermni-2re réel positif 


(2 conétion es soi irrationnel), Du point de vue pratique, Le spectre 


ce Éishingee Éffisilernent d'un spectre continu, tout Au moins pour les 
ercrÂes vileuse és 14, 


On aoerz enfin ous Les forradles ciÂeseus donnent des solutions 
press periohiause condlerses €s l'eguzion (6,1), Cette équation n'étant 
pes Vinkrire, ces sosions ne fournissent pas directement les solutions 
séalles, oui sedles som phytiquermment intéressantes, Pour obtenir des 
shutions slelles, on Genre reropharer (6.4) per 


4 = 4 241% "3 # à, 2 
24 241604) as 10%5#h47 4) 
z Î 2 A € s B,° £ 
LA 
on per 
# 
MS = À QE 5 
z=1 3 _É sin (2x -D4t #4) 
#5 


bris Les formes finales som plus compliquées 2 écrire, 
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SUR LE THÉORÈME DE LEVY-CRAMER 


par 


M. D. DUGUE 


(Faculté des Sciences de Paris - Ecole Polytechnique) 


Il arrive parfois que l'énoncé d'un théorème soit donné par un mathé- 
maticien et sa démonstration par un autre. L'histoire mathématique 
comporte quelques exemples de ce genre dont un des plus récents est le 
théorème donné par M. Denjoy en 1904 et établi par M. Ahlfors en 1926. 
Ces résultats sont en général des faits mathématiques d'une grande 
profondeur et d'une grande difficulté. Ils sont la source d'autres recher- 
ches mathématiques. Tel est le cas du célèbre théorème de Lévy-Cramér 
que M. Paul Lévy avait donné comme très vraisemblable longtemps avant 
que M. Cramér l'établisse en 1936. 


Il nous est agréable d'apporter en hommage à M. Paul Lévy les 
résultats qui suivent dont je précise que l'idée m'est venue à la suite 
d'une conversation de M. Lukacs me rapportant un exposé de M. Linnick 
à un Séminaire de l'Institut Indien de Statistique. Malgré des lettres 
envoyées à Léningrad pour connaître le point où en étaient les recherches 
de M. Linnick je n'ai pu obtenir de réponse. Une lettre de M. Lukacs 
m'a informé que M. Linnick comptait publier dans le n° 11 du Vestrik 
Leningradskogv Universitate un théorème établissant que si l'on a : 


ARE Lips con 

étant la fonction caractéristique d'une variable normale, a,;,...,&, 
étant des nombres réels et positifs etw,,...,w, des fonctions caracté- 
ristiques, ilen résultait nécessairement quew,,...,, étaient les fonctions 
caractéristiques de variables normales. M. Lukacs m'a en même temps 
communiqué la démonstration oralement donnée par M. Linnick qui ne 
paraît pas utiliser le préambule que je donne sur les fonctions absolument 
monotones et qui ne paraît pas pouvoir être étendue directement à la loi 
de Poisson, Je citerai dans le cours de ce mémoire les résultats qui 
appartiennent à M. Linnick en regrettant de ne pouvoir être plus précis 
sur ce point. 


Le théorème de Lévy-Cramér est le suivant : 
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2 
z 
Si l'on a e? Pi Pari Pa étant des fonctions caractéristiques il en 
2 2 ZL'-imz 


7 ot Li -c 2 2 
résulte que ( = Ron et Y2= e ? 2 (o, 3 Op et m étant réels). 


Raïikoff a ensuite donné le théorème suivant : 


Si l'on a : e Me*-1) = Ya sŸi et Pa étant des fonctions caractéristiques 
il en résulte que : 


w = eM(e-1)+imz V2 = e Me-)-imz (ra réel ;X , A4 , 2 Téels positifs). 


On voit aisément que ces deux théorèmes entraînent immédiatement 
les conséquences suivantes : 


EN LE Pa 
FES EL TIR 2 = œ@i pr" AVEC Pis Pr... Pn: A» d2:...qnentiers 


positifs,w, ,... ®, étant caractéristiques il en résulte encore que : 


SR ARE 
ToK rime 


1, D 


Û Pi F : 
2°) si exte"-1) = p4 PAL ce Qnats Pis Ppsese Pns Ar... q, étant entiers 
positifs etw vs. caractéristiques, il en résulte que : 


pre ete -t) + imgz 

Le but de ce mémoire est d'étendre ces deux résultats. au cas où les 
exposants sont des nombres positifs quelconques rationnels ou irration- 
nels. Je rappelle que celui qui concerne les variables de Laplace-Gauss 
est dû à M. Linnick avec une démonstration qui me paraît différente; je 
crois inédit celui qui concerne les variables de Poisson. 


1 - UN THÉORÈME SUR LES FONCTIONS A DÉRIVÉES TOUTES 
POSITIVES 


On appellera série de Taylor associée en 0 à la fonction f la série : 


(n) 
A Ce 


n ! 


n 


Nous allons établir le théorème suivant : 
THÉORÈME lI,l 


nr Donna f, ff 0; Asp ses, Étant réels et positifs , 
f;, fp:... f, étant des fonctions de x positives à l'origine, ayant à l'origine 
des dérivées de tout ordre positives ou nulles les séries de Taylor asso- 
ciéessendO à. fi, f2,.. fn convergent au moins dans le cercle de conver- 
gence de la série associée à g. 


On appellera F les fonctions analytiques définies par les séries de 
Taylor associées aux fonctions f, G la fonction analytique définie par la 
série associée à la fonction g et ÿ la fonction dont la série de Taylor a 
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" . f 
pour coefficients les valeurs absolues des coefficients de celle de . 
Puisque g n'est pas nulle en 1, on peut écrire : 


ul 
Dr ff... fiafin ee. fn = PRE 
| 


1 
Les dérivées en 0 de & fj... fn sont inférieures en module aux déri- 


vées en 0 deY F... F,. Les a; étant tous positifs et les dérivées en 0 de 
f,...f, (qui sont celles de F, ...F,) étant toutes positives ou nulles il s'en 
suit que les dérivées en 0 de f!:f,... f;, f;,, ... f. sont toutes inférieures 


2 N 1 
ou égales à celles de FF Ë EME Donc Mont pouritontrn 
L 


1 
ESS RSS 6 4 .. E< a SF pute 


le signe <€ signifiant comme d'habitude que la série écrite à droite majore 
la série écrite à gauche. On a donc : 


L 
2 Hi EE ete nf Es]n sos En 
l ! 
je 
Ou en posant} = % = A ctÆnss CF X X'< AX 
ï ! 


A est par hypothèse une fonction analytique à coefficients tous positifs 


; G' 
dont le cercle de convergence est celui de G° Le rayon de ce cercle est 


le plus petit des deux modules suivants : module de la singularité de G le 
plus proche de l'origine, module du zéro de G le plus proche de l'origine. 


Considérons l'équation différentielle : 
Y'=AY 
et une intégrale Y, telle que Y, (OUI f, (DRE f,(0). 


On voit en calculant de proche en proche les coefficients de Y par 
identification que ces coefficients sont supérieurs à ceux de X (les coeffi- 
cients de À sont tous positifs). Donc 


X € Y, 


Comme * = ÿ, (0) eh Aa Y, est holomorphe au moins dans le cercle de 
convergence de À et il en est de même de X. 


D'autre part, F, F>... F5, = X. F(0),..., F5, (0) et X(0) sontdifférents 
de 0 par hypothèse, On pourra prendre toutes ces quantités égales à 1 et 
on en déduit très aisément que F;< X et par suite que Fj converge au 
moins dans le cercle de convergence de X, donc dans celui de À, 


Montrons maintenant que le cercle de convergence de F; est au moins 
celui de G(et non pas seulement celui de A, c'est-à-dire celui passant 
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par le zéro de G le plus proche de l'origine, si G a‘ un zéro intérieur à 
son cercle de convergence, ce qui n'est pas exclu par ce que nous venons 
d'établir). Considérons la fonction analytique G; supposons tout d'abord 
qu'elle n'a pas de zéro sur l'axe réel positif à l'intérieur de son cercle de 
convergence en 0. Soit R le rayon de convergence de G en 0. Dans un 
cercle de centre 0 et de rayon R-E, il y a un nombre fini de 0 de G. Soit 
h la plus petite valeur absolue des parties imaginaires de ceux de ces 
zéros dont la partie réelle est positive. Par hypothèse on a h=0 puisque 
G n'a pas de zéros sur l'axe réel positif. On a F*! ... Fn°=G. Partant 
de 0 on pourra prolonger analytiquement sur l'axe réel positif les fonctions 
F; jusqu'en R-£, puisqu'en un point quelconque de l'axe réel positif inté- 
rieur au cercle de convergence de Fi, F;j a toutes ses dérivées positives 


et que la démonstration précédente utilise uniquement le fait que les 
G" 
dérivées soient positives, le cercle de convergence de G autour de tout 


point de l'axe réel positif intérieur au cercle de convergence en 0, ayant 
au moins comme rayon h (à moins qu'il ne rencontre le cercle de conver- 
gence de G en 0). La fonction F; est donc analytique de 0 à R-e sur l'axe 
réel positif, quel que petit que soit es. Mais Fi a toutes ses dérivées posi- 
tives à l'origine. Donc en vertu du théorème de Pringsheim la série de 
Taylor de F; en 0 converge dans le cercle passant par la première singu- 
larité atteinte sur l'axe réel positif. Donc la série de Taylor de F;i en 0 
converge au moins dans le cercle où G converge : ceci dans le cas où G 
n'a pas de zéro sur l'axe réel positif à l'intérieur de son cercle de conver- 
gence en 0. Montrons maintenant que G ne peut avoir de zéro positif à 
l'intérieur de son cercle de convergence en 0. En effet, appelons p le 
module du zéro de G situé sur l'axe réel positif à l'intérieur du cercle de 
convergence en 0, le plus voisin de 0, Ce que nous venons d'établir mon- 
tre que Fi est quel que soit i analytique dans un cercle de centre 0 et de 
rayon p. Quand z tend vers p sur l'axe réel positif F;(z) étant non dé- 
croissant doit tendre vers une limite non nulle (F:(0)}æ# 0). Donc 
F, (z)°'... & (z) "doit tendre vers une limite non nulle ce qui estincompa- 
tible avec le fait que le produit G(z) doit tendre vers 0. 


Le théorème I,1 est donc établi dans sa généralité, 


Montrons le théorème suivant que nous utiliserons pour généraliser 
le résultat de Raïikoff. 


THÉORÈME I.2 : 


Si l'on pose nn. . fn= CRE CA sr  étantitous positifs et f4, fo....,fn 
à dérivées toutes positives ou nulles à l'origine la série de Taylor associée 
à f; représente la fonction e*i**M (A; étant positif), Dans ce cas g et G sont 
confondus, 


e* étant une fonction entière, d'après le théorème I,l F; sera une 
fonction entière. e”* n'ayant pas de zéros F; ne devra pas non plus avoir de 
zéros,. Donc F; devra être de la forme : eÿi(x*) » pi (x) étant une fonction 
entière. Comme F; est représentée par une série entière à coefficients 
tous positifs, eŸi(®9 est égale au maximum du module de Fi dans le cercle 
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de centre O et de rayon x.w; (x) est donc une fonction non décroissante de 
la variable x = 0. Pour x = 0 on peut prendre tous les Bow oi (etpar 
suite les M ,... F) égaux à 1, Donc; (0) = 0 etw; (x) > 0 pour x = 0. 
Comme}, a; w; (x) = x les «; étant positifs il en résulte que 


ai pi(x) Æ x 3 


Gi (x) étant le maximum sur le cercle de rayon x de la partie réelle de 
wi (z) il résulte du théorème de Liouville-Hadamard que wi (z) est un 
polynôme de degré inférieur ou égal à 1; ce qui établit le résultat. 


2 - EXTENSION DE RÉSULTATS D’ARITHMÉTIQUE DES FONCTIONS 
CARACTÉRISTIQUES 


Dans le cas où l'on a à étudier des relations de la forme w = Press n 
PrPioe..rPn étant caractéristiques on peut s'aider de la signification de 
cette équation. Le problème est plus compliqué dans le cas où l'on a: 
g= PL'-..n" (ous ...&, étant simplement des nombres positifs). Pourtant 
à cause des résultats du paragraphe précédent beaucoup des résultats 
d'arithmétique des lois de probabilités restent valables. Montrons : 


THÉORÈME Il. I : 


Si l'on a; (a =piprt Fe Pa Pris Pare. Qn étant des fonctions carac- 
téristiques y s Anse: Lh étant des nombres positifs et si la variable 
aléatoire dont y_est fonction caractéristique a des moments d'ordre quel- 
conque il en est de même des variables dont les fonctions caractéristiques 
sont les Qi. 

Ce résultat s'établit très simplement sia,,...,@n sont des entiers 
(voir par exemple D. Dugué, Arithmétique des lois de probabilités 
(Mémorial des Sciences Mathématiques)). Il me parait contenu dans 
l'exposé de Linnick avec une autre démonstration. 


La démonstration du théorème II,1 sera fondée sur le résultat suivant: 


Si (t) est une fonction caractéristique réelle, wl?p+2) (t) existe si et, 


seulement si : 


est bornée quand t tend vers 0 ($®° signifiant dérivée Kième). 


Pour nous ramener au cas de fonctions caractéristiques réelles nous 
Re arr 
multiplierons les deux membres de l'égalité : 


gt) =[o ()]".. [en (t)]" 


par ceux de l'égalité que l'on en déduit en changeant t en -t. D'où : 


p (tp (24) = (es DT" ...[en Ego 0] 


2 
Si donc la première égalité est vérifiée onendéduira en posant|® (t)| =®(t) 
qui est une fonction caractéristique réelle : 
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œ , a 
dre l'o to eo tre 
Siv(t) est indéfiniment dérivable il en sera de même de Ÿ(t) réelle. Si l'on 
établit que dans ce cas O;(t) est indéfiniment dérivable on aura établi le 
théorème car : 


Sivp(t)? (-t) est indéfiniment dérivable il en est de même dew(t). Pour 


la démonstration des deux théorèmes qui viennent d'être indiqués voir le 
Mémorial des Sciences Mathématiques déjà cité. 


Nous sommes donc ramenés au cas oùw (t) est réel (et symétrique) 
ainsi que 4; . Montrons que si (t) a une dérivée du second ordre il en est 
de même de y; .w; (t) étant réel et inférieur à 1, on a : 


y (t)= pi (t) 
- - of _ 1 -v; (t 
Donc : Leg 6), 22 67 0) gps PO En 
avec 0< 0 1. D'après l'hypothèse pal est bornée quand t tend vers 0, 
Il en résulte que HE) nest aussi et par suite que wi (t) existe 


Il s'agit maintenant de montrer que sivw;i a des dérivées jusqu'à l'ordre 
2 P; si a une dérivée d'ordre 2p+2 il en est de même de wi = 


Onsam: 
t 0 
dif sentir 2nb pe 
à ' ?n 
Sr SES op + 
Pour calculer la dérivée 2 pième nous considérons -l comme le produit 


Pi 
1 — : 
de par Het nous dériverons 2 p-1 fois l'égalité précédente ce qui est 
possible puisque d'après nos hypothèses toutes les dérivées d'ordre 2p 
existent. On a : 


1 Fr 1 EP 
pot Capa, QUO D +... =D ai [er gt Ch (gi + | 


On aura : 
[pet (o) - LU (yake) ]+ c4, Ler-%(0)6 (0 - pr? He's 


L ll L 
> « Leo g (or pin (6) Gt]+ cu, [eitrox 2 (on - gere) GICICIE 


En multipliant les deux membres par (-1)° et en divisant par t? on voit 
d'après les hypothèses que le premier membre tend vers une limite quand 
t tend vers 0. En effet, le premier terme est égal à : 


ty [ (#20) = gp (2) (+) g(0) +90) -ÿ{t) pl) «| 


Il tend vers une limite puisque 6 (t) a une dérivée d'ordre (2p+2). 
Puisque (t) est réel et symétrique ses dérivées à l'origine d'ordre impair 
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ET 1 
sont nulles ainsi que celles de —, Le second terme sera donc : 


l ' 
(2p-1) ©) (t) 
creer e D, 


it 
Il tend vers une limite égale à (-1}° ere g{?P) (0) (0) et ainsi de 
suite ; tous les termes du premier membre tendent vers une limite. Dans 
le second membre les termes autres que le premier tendent tous vers une 


limite pour la même raison que our le premier membre (nous supposons 
que les 6; ; ont des dérivées jusqu'à l'ordre 2p). Donc : 


=Î 1 
.ll2 = 2 Es 
LE 2 [el n(0) gr (0) - piCP (+) (| 
tend vers une limite quand t tend vers 0. Cette quantité est donc bornée au 


voisinage de t=0. Chacun des n termes de cette somme est positif, Donc, 
med terme de la somme est borné. Or, l'un d'eux peut s'écrire : 


Te {P)(0) - gi() &)] x (0) + 70) - 7 at)] 4 QU) 


Qu: 1 
ne (0) “] tend vers une limite quand t tend vers 0 puisquewi" (0) 
! 


= Le 
existe. Donc si (wi (0) = wi (29) (t)) est borné et par suite il existe une 


dérivée d'ordre 2p+2 pour tous les indices i. Le théorème Il,1 est donc 
établi. 


Montrons maintenant : 


THEOREME II.2 : 


Sil'onaw- st (ras HÉe 5 À 5 Apres, positifs ee Pr rare ePn 
fonctions caractéristiques et ® analytique dans une bande à l'intérieur de 
laquelle est l'axe réel, > PU Pr res Pn sont analytiques au moins dans la 
bande d' analyticité de p. 


Rappelons une propriété importante des fonctions caractéristiques. 


Elles coincident avec la fonction analytique définie par la série de 
Taylor qui leur est associée à l'origine et leur domaine d'analyticité com- 
prend la bande parallèle à l'axe réel qui contient le cercle de convergence 
ayant pour centre l'origine. 


Ce théorème est donné par M. Paul Lévy, p. 41, dans son livre 
Théorie de l'addition des variables aléatoires! 


La condition de l'énoncé : l'axe réel est intérieur à la bande d'analy- 
ticité de ? (autrement dit n'est pas frontière) me parait pouvoir être levée. 
Dans le cas où &j , Gp»... 4n Sont rationnels l'arithmétique des lois de 
probabilité (voir le Mémorial cité) montre que le théorème estencore vrai 
même si l'axe réel est frontière de la bande d'analycité dew. Il y a donc 
de fortes présomptions pour qu'il en soit de même pour a ,@p,s.e 5 &n 
réels rationnels ou irrationnels , La démonstration que je vais donner 
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impose toutefois la condition de l'énoncé du théorème II.2. Ce théorème 
suffira pour les démonstrations de ce mémoire. | 


Siw est analytique donc indéfiniment dérivable, il résulte du théorème 
I,1quewi»w%,:...:#, Sont indéfiniment dérivables, 


Nous commencerons par établir le théorème dans le cas où 
P 5 Di 52 ses Pn sont les fonctions caractéristiques de variables symétri- 
ques et par suite sont elles-mêmes symétriques et réelles[w (t) =4 (-t)|. 


Dans ce cas (t) a ses dérivées d'ordre impair nulle à l'origine et 
ses dérivées d'ordre pair alternativement positives et négatives (V-u) 
aura des dérivées à l'origine toutes positives; il en sera de même de 


gi (V-u). 

D'après le théorème I.l1 et du fait que les fonctions caractéristiques 
coincident avec les fonctions analytiques associées à l'origine, il en 
résulte que le cercle de convergence de w; (V-u) a un rayon supérieur ou 
égal à celui de (V-u) et la bande d'analyticité de Pi {t) recouvre la bande 
d'analyticité dev (t)s 


Dans le cas oùvw(t) et w:(t) ne sont pas symétriques, on considérera le 
? Pi Y: q 


: 5 7%! œn } 
produity (t)p (-t) égal a[v (t) (2 (-1)| muse [én (t) Pn (+)] . On pourra appli- 
quer le résultat que l'on vient d'obtenir sur les fonctions caractéristiques 
symétriques. 


La bande d'analyticité dey (t)w(-t) sera recouverte par la bande 
d'analyticité de Gi (t) vi (-t) par conséquent par la bande d'analyticité de 
pit) d'après les résultats d'arithmétique des lois de probabilité. 


La bande d'analyticité de ? (t)? (-t) est la bande symétrique par rap- 
port à l'axe réel et dont la frontière passe par le point singulier dew(t) le 
plus rapproché de l'origine (d'après les résultats connus sur les fonctions 
caractéristiques, ce point est sur l'axe imaginaire pur). 


Pour obtenir le théorème II.2 il suffit de remarquer que sig (t) est 


(t+iy) 


caractéristique la der rs est caractéristique, si iy est intérieur 
à la bande d'analyticité. 


Car (a (t+iy) = four daF (x) - fe e Y* dF(x) 


et /eY* dF(x) est convergente si iy est intérieur à la bande d'analyticité. 


On pourra ainsi prolonger de proche en proche sur le segment de l'axe 
complexe intérieur à la bande d'analyticité. La relation® =..." 
sera toujours valable et la bande d'analyticité de Yi (t) recouvrira toujours 
la bande que l'on obtiendra pour la fonction w. Finalement, la bande d'ana- 


lyticité de qi (t) recouvre la bande d'analyticité dev (EL 


Mais le raisonnement suppose que l'on puisse prolonger ? à partir de 
l'origine ce qui impose que soit analytique à l'origine. 
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3 - APPLICATION AU CAS OU ® EST LAPLACIEN OÙ POISSONNIEN 


Il est possible maintenant d'utiliser les résultats précédents pour 
établir les deux théorèmes extensions des théorèmes de Lévy-Cramér 
et de Raïikoff annoncés au début de cet article. 


THEOREME lIII.l 


Siy 5 Pt3-..Pn sont caractéristiques , w laplacien, ai, ,...,a, réels 
positifs et si ® = (HE vi! ser Pi 5@2 5-.+Pn SON laplaciens. 


Ce résultat a été établi par Linnick par une autre méthode. Il était 
connu quand a, ,...@&, Sont entiers positifs. On pouvait facilement l'étendre 
au cas où , a) »..- An Sont rationnels. Le cas où «a, ,&) ,...% ne sont 
pas tous rationnels présente plus de difficultés. 


D'après le théorème II1.2 puisque la bande d'analyticité dew est l'en- 
semble du plan il en résulte que ProPare-ePn SONt holomorphes dans tout 
le plan donc entières, Comme y n'a pas de 0,4%, ,W2,...,wA Sont des fonc- 
tions entières sans zéro et par suite y; = eŸi,w; étant une fonction entière. 
On pourra par l'addition de quantités certaines s'arranger pour que l'une 
des variables aléatoires dont 4, ,...,4n Sont fonctions caractéristiques 
prenne avec des probabilités non nulles des valeurs positives et des valeurs 
négatives. Ilen résulte que quand y augmente indéfiniment en valeur abso- 
lue Y; (iy) tend vers +w. Par suite, en vertu des propriétés du maximum 
d'une fonction caractéristique (voir D. Dugué, Analyticité et convexité 
des fonctions caractéristiques, Annales de l'Institut Henri Poincaré 1951) 
on aura 


- sur le cercle de centre © et de rayon R, pour tout R assez grand : 
2 
Rpi(xtiy}emaR y (xtiy) < RE (i4j) 
&; 
( œ étant l'écart type dew ete arbitrairement petit positif). En vertu du 
théorème de Liouville-Hadamard il en résultera que w; (x +iy) est un 


polynôme de degré au plus égal à 2; ce qui établit le théorème III. 1 : 


On a de même : 


THÉORÈME II.2 : 


Sip = p'pit ... Yn> 4 5 Dis Pas. Qn étant caractéristiques, ai »,..:@n 
réels positifs, si est égal à e'"z(fonction caractéristique de la variable 
certainement égale à m)w, sn Sont égales à ePM,.-., Mn. 

Ce résultat s'obtient immédiatement en remarquant que wi (iy) est une 
fonction convexe de y et que dans ce cas © aivi(iy) est une fonction 
linéaire. Il en résulte que chacun des termes de cette somme doit être 


linéaire. 


Montrons le : - 
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THÉORÈME IIL.3 : 


Si le support de la probabilité de la variable dont est fonction carac- 
téristique est l'ensemble des entiers positifs ou nuls et si =. Pr 
CET réels positifs) le support de la variable dont pi est fonction 
caractéristique est contenu dans l'ensemble obtenu en faisant subir à 


l'ensemble des nombres entiers positifs ou nuls la translation hi avec 
S ch; = 0, si la fonction caractéristique de contient l'axe réel à l'inté- 
rieur de son domaine d'analyticité. 

Ce résultat s'obtient aisément six ,...,a, Sont rationnels. C'est un 
cas particulier du fait que le support de la somme de deux variables aléa- 
toires indépendantes est la fermeture de la somme vectorielle des supports 
de chacune des deux variables. 


Si une variable aléatoire est positive, plus généralement, est bornée 
inférieurement, sa fonction caractéristique sera analytique au moins dans 
le demi-plan I z >0. 


L'énoncé du théorème III.3 impose la condition que l'axe réel soit 
intérieur à ce domaine pour que l'on puisse appliquer le théorème II.2. 


D'après le théorème @is---sWn Seront analytiques au moins dans le 
demi-plan Jz=0, 


La démonstration est fondée sur l'étude du comportement des fonc- 
tions caractéristiques sur l'axe imaginaire pur (9 z —0). 


1°) Si une variable aléatoire n'est pas bornée inférieurement, on a 
pour sa fonction caractéristique h(iY}) l'inégalité suivante : 


h(iy) 4 2 dF(x)=evr F (m) 


m négatif étant arbitrairement grard en valeur absolue et Y —0. 


2°) De même si une variable aléatoire est bornée inférieurement par 
M,ona k 


b(Lv) fe M Ar (x) <e M" avec Y —0 
D'après cela,on auraw ( iY)=1 pour Y= 0 si y est la fonction carac- 
téristique d'une variable aa ae à support positif. 


3°) Enfin si M est la borne inférieure d'une variable aléatoire et si 
F (M+0) = 0 (c'est-à-dire si la borne inférieure de la variable aléatoire a 
une probabilité nulle),. on aura : 


Eim h{iy}e'"=0 En effet pour Y=0 


Y2= +00 


+M+E€ +00 és +0 
AG) =f e"aF(x) fe" rte fe" à r 69 + fl e ME) 4r (x) 
= AM M+e M+ 


Ê 
Donc pour Y 0 et quel que soit £& —0 


h(iY)= e "MF (+M+e) + e-Y(M+e) ot 
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e'" h(iY)=F(Mte)+teYf;e étant pris tel que F(M+e) soit inférieur àT ce 
qui est possible d'après l'hypothèse faite sur F(x), on prendra Y assez 


YŸ 


grand pour que e ‘‘ soit inférieur a, ce qui montre que l'on peut prendre 


Y assez grand pour que eŸ"h{iY) soit arbitrairement petit. 
Ces trois propriétés vont permettre d'établir le théorème IIl.3. 


Supposons qu'il y ait pour chaque variable X; dont la fonction carac- 
téristique estw; , une valeur h;j telle que F; (hi) =>0 avecS jaihj=—0. On 
aura pour Y —0 (à cause du l°) 


Le GT" fe Go] > een ("Ft 


qui augmente indéfiniment quand Y tend vers +0 ce qui contredit le fait 
quew (iY)—=1 pour Y—0. Il est donc impossible que l'on aitS ‘œjh; <0O. 
Toutes les variables sont donc bornées inférieurement et l'on peut leur 
ajouter des quantités certaines telles que la borne inférieure de chacune 
d'elles soit nulle. On supposera maintenant que cette correction a été 
faite. 


Après cette opération supposons que la variable X; ait pour support 
l'ensemble a des entiers 0,1,..., n, avec une répartition de la proba- 
bilité sur cet ensemble égale à rh (x) et un ensemble 8,0) de valeurs non 
entières dont la répartition de probabilité sera égale à F{?) (x) avec : 
F0 (x)+ Fi) (x) = F; (x). Si la borne inférieure de l'ensemble 8% est une 
valeur entière, on pourra faire entrer la probabilité de cette valeur dans 
F;" (x) ce qui fait que dans ce cas F® (x) est continue à droite en ce point. 
F° (M +0) = 0 si M est une valeur entière, Ce point est important pour la 
suite. On a alors : 


gi (iY) = pl) +plile +4... + pli ei +Ai(iy) 
l'entier nj étant tel que la borne inférieure de l'ensemble 8%) soit égale à 
ni +h;i (0=h— 1). On aura donc : 
e "nithi) — A; (iy)—e"lMithité) à,(e) pour Yæ0 ete — 0 avec 
ai (ct) 0. On prendra hi+e 1. 
Il en résulte que 
[si Gy)]"= QG) 4 qi e +... + qfi ei + Bi(iy) (4 0) 
avec Bi e*(nithi) +; (iv)= e{nithise) b;(e) avec Pi e et 
b;(e) 0 cette fois pour Y—0 suffisamment grand. 
Soit n+h le plus petit des nj +h; ... On aura : 
Le, GA] 2e. [ee GA] ko + ke + + + Cv) 


dVéc:" Ce leth) ccavysulimadee) avec C, € et c(e)}=—0 
pour Y suffisamment grand. À cause de la remarque faite tout à l'heure : 


(Fr (M+O) = 0 si M est entier) 
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ona sih=0, Lim e)" C(iy) = 0.C'est la conséquence immédiate du 3°)de 
Y2+00 


tout à l'heure; car alors si h;j = 0, ve on Ai (iY)=0 
=2+0 


a a 
Le fait que Y (iY) =[v, (ix)] an Pier (i)| "avec (iY) fonction carac- 
téristique d'une variable aléatoire à support de valeurs entières positives 
ou nulles n'est pas compatible avec ce résultat ; car alors on a : 


(3 (iY)= Pt+tPeŸ+... + Pen +... = kç+tkieYŸ+kne-nŸ +C(iY) 


En faisant tendre YŸ vers + on en déduit EP, = k, ; en multipliant par 
e' après avoir retranché EP, et k, des deux membres on en déduit en faisant 
tendre Y vers +w, k, = P, ,... et ainsi de suite jusqu'à : 


PheY+...=ke"Y +C(iy) 


en multipliant encore les deux membres par e*"Ÿ et en faisant tendre Y 


vers +o comme en C(iY)tend vers 0 (que h soit positif ou nul) on a P, = kn 
et par suite Ph, e (#4 ,,, = C(iy); C(iY}= eY{nthte) <(e) pour Y suffi- 
samment grand avec h +e— 1 ce qui contredit cette égalité. Il est donc 
impossible que les ensembles 8° ne soient pas tous vides : ce qui établit 
le théorème III.3, 


Donc, le support de chacune des variables X;i est contenu dans l'en- 
semble des entiers positifs ou nuls. En posant e? = u, on transforme les 
fonctions caractéristiques en fonctions génératrices et siy (z) = ur 
(variable de Poisson), on a : 


en = (us... £(u)er 
f,,..., f, ayant leurs dérivées à l'origine toutes positives et coïncidant 


avec leur série de Taylor associée à l'origine. D'après le théorème I.2 


ona :f;j=eMutHi1=>0. Comme f;(1)= 0,Hj = -Aj et par suite : 


THÉORÈME II. A4 : 
œ 


Siy = ex(e*-1) zyi! ...pn" avec u,...an > 0 et y +... caracté- 


ristiques,Y,,W2.--ŸA sont des fonctions caractéristiques de variables 
de Poisson ce qui généralise le théorème de Raikpff. 


ANNEXE 1! 


Rappelons quelques problèmes posés dans cet article ainsi que d'au- 
tres suggérés par les travaux de M. Paul Lévy. 


1°) Le théorème I1.2 est-il encore vrai si l'axe réel est frontière de 
la bande d'analyticité? On obtiendrait ainsi un théorème tauberien. 


I1°) Y a-t-il des fonctions caractéristiques de la forme eAlt), A(t) 
étant une fonction entière d'ordre inférieur à 1 ? (un théorème de 
Marcinkiewicz-Dugué affirme cette impossibilité si À (t) est un polynôme 
de degré supérieur à 2). 
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IlI°) Y a-t-il des fonctions caractéristiques entières ayant le maximum 
de valeurs asymptotiques égal au plus grand entier contenu dans 2p+1l, 
P étant l'ordre, d'après le théorème de Denjoy-Ahlfors). 


Ver serait intéressant d'étudier la structure de l'ensemble des 
fonctions [w (t)] . Le produit de deux telles fonctions n'appartient pas 
forcément à l'ensemble, Par exemple :[cos (1e [cos 2tM'n'est pas unw*. 
S'il en était ainsi il devrait exister un a tel que : 


a V2 
[cos tje [cos 2t] œ soit caractéristique. 
Z VZ 


a æ I . 0 “ . 0 
[ cos t]° et [cos 2t] étant analytiques autour de l'origine il devrait y 
avoir analyticité dans une bande ce qui entraîne que À et V2 devraient tous 
= œ 


deux être entiers,ce qui est impossible, 


ANNEXE II 


Les résultats présentés dans ce travail me paraissent des cas parti- 
culiers de l'énoncé un peu vague suivant : 


Si dans un théorème, ilest question d'une suite infinie de coefficients, 
on obtient en général un résultat intéressant en imposant à tous les coeffi- 
cients d'être positifs. 


Exemples : 
a d—— 


1- THÉORÈME DE PRINGSHEIM : Une fonction analytique à coeffi- 
cients tous positifs a sur son cercle de convergence un point singulier sur 
l'axe réel positif. 

I1- THÉORÈME DE VALIRON : Si une fonction entière d'ordre infini 
a tous ses coefficients positifs, elle a l'axe réel positif pour demi-droite 
de Julia, 


III - THÉORÈME DE BERNSTEIN : Si une fonction indéfiniment déri- 
vable a toutes ses dérivées positives sur un segment elle est analytique 
sur ce segment. 


IV - THÉORÈME DE THOGER-BANG-BOREL : Si une fonction quasi 
analytique a toutes ses dérivées positives en un point elle est analytique. 


V - THÉORÈME DE DUGUÉ : Si une fonction continue est limite de 
polynômes à coefficients tous positifs, la limite ne peut être qu'uniforme 
et la fonction analytique. 


VI1- THÉORÈME DE LEBESGUE : Si une fonction continue et symé- 
trique a tous les coefficients de sa série de Fourier positifs, elle est égale 
à la somme de sa série de Fourier. 


VII - THÉORÈME DE DUGUÉ : Une fonction caractéristique est égale 
à la somme de sa série de Fourier. 
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SUR LA DÉTERMINATION DU SPECTRE 
DE L'INVERSE D'UNE FONCTION ALÉATOIRE 
ET SES APPLICATIONS 


par 


R. FORTET 


1 - INTRODUCTION 


1. REMARQUES GÉNÉRALES 


Dans ce mémoire, nous considérerons des variables ou des fonctions 
aléatoires ou non, mais toujours réelles. 


X étant une variable aléatoire, on a assez peu étudié (1) la variable 
aléatoire Z inverse de X, c'est-à-dire définie par : 


il y a pour cela deux raisons : 


a ) L'inverse d'une variable aléatoirenese présente pas très fréquem- 
ment dans les applications; 


B) En général,la valeur 0 est une valeur possible de X, et pour cette 


1 TE 
valeur le rapport Z Lune pas de sens, ou si l'on veut est infini, 


À propos de a), observons qu'il y a tout de même quelques problèmes 
intéressants où l'inverse d'une quantité aléatoire s'introduit naturellement; 
nous en étudierons un exemple par la suite, exemple qui est précisément 
à l'origine de ce travail. 


A propos de fi), il est clair que si Pr(X =0) >0, il y a une probabi - 
lité positive pour que Z = æ; dans l'usage habituel, on réserve l'appellation 
de variable aléatoire aux nombres aléatoires qui ont une probabilité nulle 
d'être infinis ; alors Z n'est pas une véritable variable aléatoire, Mais si 
Pr(X=0)=0, alors Z est une véritable variable aléatoire. Pour fixer 


(1) Cf. par exemple J.H. Curtiss [1], R. Feron et C. Fourgeaud [1]. 
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les idées, et aborder tout de suite le cas le plus intéressant, supposons 
que la fonction de répartition F(x) de X possède une densité f(x) continue, 
dérivable à dérivée bornée dans tout intervalle fini, et telle que : 


(0) 07 
alors la fonction de répartition H(Z) de Z possède une densité 
1 1 
h(Z) 5 ) ° Z? 


mais Z n'a pas d'espérance mathématique et par suite n'a pas de moments 
en général, En effet E(Z) existe si et seulement si E(|Z|) existe, c'est-à- 


dire si : 
ns VE és 
AREA RARE no —— f(x) dx < + 
sa D) ee ee) LA Ge) 


ce qui précisément n'a pas lieu sous les hypothèses faites. 


Si E(Z) existait, elle serait représentée par les intégrales équiva- 


lentes : 
LE ET ee 
Fa Zh(Z)dz -J Lip -J Liço ex (&:1) 


ces intégrales ne sont pas absolument convergentes; mais elles convergent 
en valeur principale (v.p.) au sens de Cauchy; rappelons par exemple que: 


+2 
vp.] 7er re lim / Lecoes : 
x E—+0 x 


re Ne 1 
l'introduction de ce mode de convergence équivaut à considérer — dans 
x 


(1,1)non comme une fonction, mais comme la distribution v.p. es au 
sens de L. Schwartz, Ë 


Sous la seule condition que : 


lim log |x| f(x) = 0", (152) 
X—> to 


condition que nous supposerons réalisée, on sait que : 


+os +00 
v»./ Let) dx = -f log |x| f(x) dx . (1,3) 


Dans ce mémoire, nous définirons l'espérance mathématique de 
l'inverse Z = 1/X d'une variable aléatoire X par (1,3); nous adoptons 
ainsi une définition de l'espérance mathématique plus large que la défini- 
tion habituelle; on sait que cet élargissement, auquel on avait pensé depuis 
longtemps, présente de sérieux inconvénients sur lesquels nous ne revien- 
drons pas (cf. M. Frechet[1], p. 228). Mais il faut observer que nous 
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n'acceptons ici cet élargissement que pour un problème particulier, pour 
lequel en fait les inconvénients en question ne se présenteront pas. 


D'ailleurs, et par rapport à d'éventuelles applications concrètes, 
nous pouvons justifier (1,3) en considérant la situation suivante : X est 
3 1 me 
formé par le hasard, x” Z est calculé par un dispositif que nous appelle- 
rons la ‘'machine''., Si le hasard fournit pour X la valeur 0 ou même 
seulement une valeur très petite, la machine, en fait, ne donnera pas la 
1 : - 
valeur exacte de Z = x? valeur éventuellement infinie ou dépourvue de 
sens, mais une valeur ‘'corrigée'' Z*= O(X) dont la valeur précise importe 
peu, mais dont nous pouvons supposer, sans exclure apparemment de cas 
pratiquement intéressants, qu'elle reste bornée par un nombre détermi- 
né M : 


hz%t=.6 (x) SM 
en d'autres termes, nous pouvons admettre qu'il existe un certain seuil 


€ (E petit) et que la variable ayant un sens physique est, non pas Z, mais 
Z* définie de la façon suivante : 


si Hchedr Eee ZA = 2-7; 
IX Er avec | D (x)|< M; 


or Z* est bornée, donc a une espérance mathématique : 


“\ = 1. , : 
à D PA) PE nl) d Has (x) f(x) dx 


or si le produit EM est petit, cette espérance mathématique se confond 
pratiquement avec (1,3). 


2. CAS DE X LAPLACIENNE 


A titre d'exemple, supposons que X soit une variable aléatoire lapla- 
cienne, d'espérance mathématique m, et d'écart moyen quadratique & ; 


1 2 
d'après (1,3), E(Z = est donnée par : 


+co 


1 1 
(2-2) = 7 2 Ix| ( 


ou, en posant : 


x-m 


) 3837) d() : 


x=m +0 y: 


FSS 2 
CPE ei” + dy : 2,1 
(= /icimtoy yez dy ; (2,1) 


_— co 
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on peut transformer (2,1) en posant : 


Y 
Fm, a ,y)= Ju log Im + o u du 
o 


rail m Lu, 50° ln 

So 7 à à ns re Li à legs Ho vis Sslog|m] 
une intégration par partie donne : 

+ co 
(LE LP Em 0 , y) yes dy; a) 
NE ions hoteles #7 PU | j 
posons : 
ro (7 =) = M{m, 0) ; 


une dérivation légitime sous le signe / dans (2,2) donne : 


Ô _Mm npree. #1 De met: LE 
EE on Fm P(m;0,y)y e 7 dy 


+ co 2 
m LEP 1 
: E / logim+o ylye dy +=: 


de sorte que M(m,o ) comme fonction de m, satisfait à l'équation diffé- 
rentielle : 


d 


Ge 
ù m 


M(m,.o ) + m M(m,o)=4,E (2,3) 


d'ailleurs évidemment, pour o #4 0,M(0,Sœ)=0; l'intégration de (2,3), 


en posant : 
a 
2 2 
A (a) = Efaet du , (2,4) 
o 


) - (2,5) 


donne : 


La fonction À (a) est définie explicitement par (2,4), ou encore par : 


A(o)=0, 2 A(a)+a A(a) EP 


nous poserons : 
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on à : 
ARE hr À DA (2,6) 
et par dérivation : 
D OO our re 1 (2,7) 
Si l'on définit les polynômes de Hermite Hk(a) (k=0,1,2,...) par : 


ES MT #2 "A 
€? Hk(a)=<r (er), (LE NOS er." ) 
on a : 
Hk+ + a Hxk + kHk-1= 0 pour k > 1 (2,8) 


ce qui est précisément la relation (2,7); mais les ''conditions initiales! 
sont pour Les H4x : Ho(a) = 1, H (a) = -a. 


Mais les N° (a) ne sont pas des polynômes, ce sont des fonctions 
entières de a; on a en Particulier, d'après (2,6), le développement : 


A°(a) = A(a) DS CRT RAT ai, (2,9) 


à rayon de convergence infini, avec : 


)Ù ee, 1 me (2 10) 
MT INA XSXL x(2k +1) (2 kTrI) js 
Si l'on pose 
Ax = p.p.b.s.| AC (RS 0 lice 
lBI£ 1 


une étude élémentaire à partir de (2,4), (2,6) et (2,7) montre que : 
Po SLR A1 S 1% et d'une façon générale : 
Re A (Rs. (2,11) 
où À et B sont deux certaines constantes positives. 


Toutefois la limite (2,11) est probablement loin d'être la meilleure 
possible, 
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3. POSITION DU PROBLÈME 


Soit X(t) une fonction aléatoire, réelle pour fixer les idées,du temps t 
(-æ <t < +=); soit : 
1 


Z (t) xt 
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la fonction inverse de X(t) et proposons-nous de déterminer les propriétés 
spectrales de Ÿ(t), et d'abord de calculer sa covariance : 


rte)-e[zzt]-efxcl: (3,1) 


Conformément à l'idée indiquée au paragraphe 1, nous imaginons que 
X(t) est fournie par le hasard, et qu'à chaque instant t une ‘'machine" 
calcule non pas exactement l'inverse Z(t) de X(t), mais plus précisément 
un nombre Z*({t)=#@[X(t)], la fonction bien définie #(x) étant telle que : 


8 (9 = + RCE 
14 (x)| £ M FRS ES 


€ étant un nombre positif petit et M un nombre déterminé indépendant de € ; 
en posant : 


Ri(t,7) = E (Z'(t)Z*(T)l, 


nous définirons exactement L'(t,T) par 


r(t,T)= lim I (t,tT), 
£—0o 
si cette limite existe. 


Exemple : 


Un que X(t) soit une fonction aléatoire laplacienne ; posons : 


a = Étx(t)l.b= ml x(t)ls = X(t) - a, V = X(T) - b supposons que 
E (u° }=E(V* L = l; il serait ane de traiter de la même façon le cas où 
E (U*) et E (V:) 


sont quelconques; enfin nous poserons E(UV)=r; on sait que|r| < 1; nous 
supposerons que |[rl<l, et reviendrons ensuite sur le cas|r|= 1. Alors le 
couple (U,V) a pour densité de probabilité : 


1 1 
is Vies Ver exp. ; letter uv) 


de sorte que : 


Es mn [u? ve mag lt tv-2ruvi] 
APS D A (a+u) (b+v) ÉLeV 


FFUrS 
Ib+v|? 


+ nr (atu) # (b+v) 
D 


me. É-pussle even) du dv (3,2) 
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en désignant par D la partie du plan (u;v) sur laquelle soit latuf>e, 
soit [b+v|2 € ; il est clair que si £—0 la deuxième intégrale de (3, 2) 
tend vers 0. Désignons alors par 


le (a,b,r) 


la première intégrale de (3,2). On a : 


l 
_— e 2(1- Cire LV” ru) 
Fe 7 V2r er (bn) se) (by) 7°) 


la+u|> € Ib+vIdE 


par un procédé analogue à celui qui donne (1,3), on peut dans (3,3) d'abord 
intégrer en v, et par partie ; puis on intègre en u et par partie; on en tire 
sans difficulté que pour 


E—+0, F a; b, T 
à une limite donnée par : 


ae pa: b,r)= 


PT u+v?_2ruv EH | lonlbaw)| (Lee) (tes) av - rlatr) 
I-r og (atu) log(b+v +r°) uv - r(u+v 
1 ARE 1e Cu gt ler ee CR EU UT D +r| du dv 


Nous appellerons pH (a, b,r) cette intégrale. Il en résulte que l'(t,T) 
existe, et plus précisément que : 


r(t,:T)=p(a,b,r). 
Mais il est intéressant d'obtenir d'autres déterminations ou expres- 


sions de l'(t,T) oup(a,b,r). On remarque d'abord que, d'après (3,3) et 
(3,4) les dérivées partielles : 


SH (ab,r) et a -Ha,b, r) 


existent et peuvent se calculer en dérivant (3.3) et (3,4) sous le signe / ; 
on constate ainsi que : 


: ] 
D de mn 


dr 


et que 2, te et f sont liées par une relation linéaire qui, par passage à la 
limite pour £—+0, donne la relation suivante entre et 2É : 


Les (1-53) + (1+r2) ab - r(a? +b°) H ME 


 . Pine 


Mie a 
ner Grey (a) + € + 


Le] 
14 


-b 
(1- 1-7 y Mb) (325) 
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Comme pour r = 0 on a évidemment 
p (a,b,0) Â(a) Ab) (3,6) 
on peut calculer y ( a,b,r) par intégration de (3,5), ce qui donne l'expres- 
sion suivante : 
_ {- Ce + -zreb) 
one IE ne 


l-r2 


LAG) Â(b) ei + [at ar | (3,7) 


où H(r) désigne la fonction : 


a) | M DE An) ee le 


I=r2 3 3 
ER) ete 
GS (Er 
aitbe-2ra pb 
aa {+ 21-22) É 69 
Casse 
Si |r|=1, les formules précédentes sont dépourvues de sens, si 
r = + 1, cela signifie que V = + U, presque certainement ; alors 
Ie (tt) 


est donné par l'intégrale simple : 


1 bare 
ER. e=2 du 
Tele = Jr (btu) (3,9) 


qui a un sens en général et s'évalue facilement ; toutefois (3,9) n'a pas de 
sens si : 


LÉ= AMEL" 1b=7a% OUPS 0 = Le et = -à , 


Développement dep (a, b, r): 


H (a,b,r) est une fonction holomorphe de r pour |r|< I; 5H (a,b,r) peut 
donc être développé en série entière de puissance de r : 


p (a,b,r) = Mo + Mir + Mir +... + Mkrf +... ; (3,10) 


on peut calculer les coefficients Mx en portant le développement (3,10) 
dans (3,5) et en identifiant ; il vient : 


Ms = A(a) A(b) 
Mi=abMo+[1-aA(a)-bA(b)] 
2M2=abMi+(l-a - bt) Me+[bA(a)+a A(b)] 
3M,;=abM,+1(3 - & - b?) M, +a b Mo- 1 
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et d'une façon générale pour k > 3 : 
(k+1)Mk:,=abMx +(2k-1-a-b?)MK-1+abMx-:-(k-2) Mr-s (921 


On vérifie facilement que : 


M, = — 


ob). M: = Na) Éb), M = + Aa) 1E/(b). 


alors, compte tenu de (2,7), on prouve que, d'une façon générale, les 
nombres : 


M, = T Na) Ab 


vérifient (3,11), de sorte que : 


(k) (K) 
& (a,b,r) ss Sr tb} oies 2€ (512) 


K=0 


Cas particulier a = b = 0 : 


Sia = b=0, (3,7) et (3,8) donnent : 


_ arc sinr, LT 1 T 
W (0,0,r) KT; ex ( 5 <are sinr< >) (6518) 
et par suite : 
2K 2 
£ 2 Lait Le 
Mk = O , M2Kk+1= (2k+1)! F4 VE POUR (3,14) 


li - ÉTUDE D’UN CAS PARTICULIER 


4. Supposons que X(t) soit de la forme : 
X (t) = p cos At +U(t), 


où et ( sont des nombres > 0 non aléatoires, où U(t) est une fonction 


aléatoire laplacienne stationnaire, avec 
: a. © 
EQut)]=0, E=/{|ut)|]=1, Efut)ut-b)]-r{): 
nous supposerons que U(t) admet une densité spectrale f (&); on sait que : 


r (h) 4 ei f(w) do (4,1) 


et aussi que : 
f(w)=— } eh r(h) dh (4,2) 


Soit maintenant Y(t) une fonction aléatoire laplacienne de même loi 
que Uf{t), mais indépendante de U({t); et soit à déterminer la densité spec- 
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tale g (©) de Y(t) Z*(t); car c'est évidemment cette détermination qui a 
proprement un sens physique. En vertu d'une théorie générale classique 
(cf. Blanc-Lapierre et Fortet [ 1], Chap. VIII et IX), g,(w) est donné par 
la formule suivante : 


+0 »T 
1 _iwh 
g(®) = 2/0 ré ebler! dhdt, (4,3) 


n Ru 
où on a posé : T = Il sera évidemment naturel d'adopter comme valeur 


approximative de g,(®) la valeur : 


+ FT 
JL -ioh 
sn rf frortime dh dt (4,4) 


mais il faut pour cela que l'intégrale (4,4) ait un sens, et, qu'elle soit la 
limite de (4,3). Or cela n'a pas forcément lieu, 


g(w) = 


Mais supposons, pour fixer les idées, que : 


r(h) = e-"olhl (4,5) 
où Ncest un nombre positif quelconque, ce qui correspond à : 
Fe 
f(w) = DO (4,6) 
En se reportant au paragraphe 3, on peut voir facilement que, dans le 
domaine : 


[rl <1-a (a > O0 quelconque), [al et [b| < N 


(N > 0 quelconque), He (ss b.rt'et H (a,b,r) sont bornées uniformément en 
a, b, r. Par suite, quel que soit > 0, l'intégrale : 


T 
1 . 
-iwh 
= A rte r(h)e-i®h dh dt 
Ihl>ne/0 


a un sens, et est la limite, pour E—>0, de l'intégrale : 


T 
1 : 
ce -/ fe (t,t-h) r(h) e-i®P dh dt 
Ihb>n/0 


T 
1 
Lf T(t,t-h) dt = K(h) (4,7) 


Posons : 


et considérons le développement en série de Fourier de A° (p cos Qt), 
soit : 


CN) _% inst 
Â (p cos nt) TD fks etn 


I= ce 
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pour tout r < 1, donc pour tout h # 0, et pour p £< 1, la série 


H (p cos At, p cos Q(t-h),r) 


LE He «on 00 Ne eo D), a.) 


K=IO 


est convergente, uniformément en t, d'après(2,1l1); on peut donc calculer 


K(h) en portant dans (4,7) le développement (4,8) et en intégrant terme à 
terme; on trouve ainsi : 


K(h) PE Ne (4,9) 


| ra + [ae cos Nt}) dt ; 
o 


1=-00 
on a donc : 
| NOIRE fie cos (t)° dt re) 
< Ms re p cos Qt} ET ds 2 a 
ss 


T 
L/ Ê cos At, p cosNt, 11 dt 


Or d'après (3,8), t (P cos Nt, pcosnt, r(h))admet une majoration 
du type : 


| H (p cosft, pcosANt, r (h))| & es , 


où A est une constante indépendante de het de t; on a donc pour |[K(h)|une 
majoration du même type. L'intégrale : 


el K(h) r(h)e-i°" 4h 
lhl<n 


a donc un sens, 


Posons de même : 


t 
K,(h) +f He |? cosNt, p cos Q(t-h), r 
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DOUTE EL fe (a,b,r), d'après son expression dans (3,2), est développa- 


ble en série entière de r : 
= K . 
É (2 ,b:r)= > Me,k T° ; 
K=0 


on montre facilement (par récurrence, en étudiant les dérivées successi- 
ves de H{ par rapport à r pour r = 0) que M£,Kk se met sous la forme : 


Me,k = H(e) xt) 


où (a) est une certaine fonction de a. On peut alors, en procédant à peu 
près comme ci-dessus pour K(h), obtenir une majoration de | Kç(h)|de la 


A 2 À ; 2 $ 
forme VE avec À indépendant de €, je ne reproduis pas la démonstration 


qui est longue. Ceci permet d'achever la démonstration comme quoi : 


dim 8(%) = g(w) 


5, CALCUL DE g(w): 


On peut calculer g(w) d'après (4,9) : on trouve : 


+ l£K,s |? k Qo 
g (w) = kl: kKQO+(w-Q8s) (5,1) 


K=0O,S 


L'usage de cette formule exige le calcul préalable des f,,; il suffit de 
connaître d'ailleurs les f., ; en effet, de (3,6) on tire facilement : 


fo = 1- (for +fo-1) 


frs = LE (fos+1 + Éos -1) pour s£#0; 


nf 


et de (2,7) on tire en général pour k > 1 : 


fk+1,s = - kfk-1s - (£a se + fk,s-1) 


y: 
Quant aux fs , On remarque que : 
fos = 0 si s est pair 
fo,-s = £o,s ; 
2 
£ Née en 3 
0,1 os — , 


, 


P 


on peut alors obtenir tous les f.. par la formule de récurrence : 
48 Lo,s = p° (£os+e e fo,s-2) . 


Mais l'utilisation de la série (5, 1), dont la convergence est très lente, 
n'est pas très pratique, 


DÉTERMINATION DU SPECTRE DE L'INVERSE D'UNE FONCTION ALÉATOIRE, APPLICATIONS 239 


Si p est petit, on peut procéder de la façon suivante : on remarque que 
Hp cosOt,p cos Q{(t-h),r) peut se développer en série entière de puis- 
sance de P°> sous la forme : 


H (p cos At, pcosQ(t-h),r)= 4 +} PH sect be p°" + er 


en posant cosQt=x, cosQ(t-h) = y, les FX” qui dépendent de r, mais 
aussi en général de x et y, sont définis par : 


arcrsinsr 


F7 SV 
d l+r?)xy - r(x°+y° rb - x 
Deer =. v) HT pe) (-1) ex x2k71 
TX - 3 
i den. (-1)° Àek+1 v" ‘ 


où les À2k+1 sont donnés par (2,10). On peut assez facilement calculer les 
premiers ph» eten particulier pHsona alors 


g(o)=S e(w)p#*, 


en posant : 


+00 FT 
l io 
a) À / u [p cos At, p cos Q(t-h), r(h)] et vhaË dt”; 


(e] 


On trouve ainsi, pour W = 0, par exemple : 


$ 
er) 0 
80 (0) LT 


Des calculs numériques ont été effectivement conduits avec cette 


méthode. 


REMARQUES 


1°) I apparaît que le comportement de r(h) pour h—+0 joue un rôle 
important, en liaison avec la singularité de He (a,b,r) pour r=1; ceci 
s'explique de la façon suivante : dans l'étude de 


1 
p cos Nt + U(t) 


le point critique est l'existence et la répartition des valeurs de t pour les- 


quelles : pcos Qt + U(t)=0; or il est connu que cette répartition est en 


relation avec le comportement de r(h) pour h—»0, ’ 
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2°) Une théorie mathématique générale des fonctions aléatoires du 
type es où X(t) est aléatoire doit pouvoir être obtenue à partir dela 


notion de ‘distribution aléatoire'' de Gelfand; cette question est actuelle- 

ment examinée par M. Lavendhomme ; toutefois il apparaît immédiatement 
= 1 : ; s 2 : : 

qu'en général x’ comme ‘distribution aléatoire'', est partiellement 

indéterminée t de sorte que dans le problème actuel la notion de distribu- 

tion aléatoire semble moins bien adaptée aux applications que le point de 


vue direct adopté ci-dessus, 
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GÉNERALISATION DES ESPACES LP 


par 


L. SCHWARTZ 


Faculté des sciences de Paris 


INTRODUCTION 


Le but de cet article est de développer les principales propriétés des 
"o -fonctions'' de M. Paul Levy, utilisées et introduites en calcul des 


probabilités. Les © -fonctions, que nous appellerons ici des G)-mesures 


bornées, sur un espace topologique localement compact X dénombrable à 
l'infini (1), forment un espace de Hilbert #{X), intrinséquement attaché 


_—— Az 1 À 
à X. Nous définirons plus généralement les (—)-mesures bornées, 
P 


1£< p < +æ(2), et des espaces H{X) attachés à X. 


LA FONCTION Z —+ Zl] 


Si Z est un nombre complexe, Z = peit ,et si0 < p <æ, appelons ZIPl 
le nombre pP ei, de module [Z|?, de même argument que Z (ZlPl =0 si 
Z = 0). Alors Z—Z{P) est un homéomorphisme du plan complexe sur lui- 
même; on a (uv)lPl = ulpl vlrl, (zPl)[ql = ZIPdl, mais ZztPrl zlal 4 zlp+ql si f 
est une fonction sur X, flPl sera la fonction x—+(f{(x))lPl On sait que 
UE L'(X;p), p mesure (3) > 0, si et seulement si flPlex' (X,h); on peut 


alors définir la mesure flPlh; c'est une mesure bornée (4). 


(1) Une partie des conclusions reste valable si X n'est pas dénombrable à l'infini. 
n peut aussi définir un espace , mais il semble d'intérêt très limité. 
2) On p i défini m7 is il ble d'intérêt très limité. °° 
n'est pas le dual de &#", 


(3) ‘'Mesure!' signifie toujours ici mesure de Radon, Nous employons les notations 
de BOURBAKI, Intégration, Paris, Hermann, 1952 (Actualités Scientifiques et Industriel- 
les, n° 1175), ouvrage auquel nous référerons par : BOURBAKI, Int. 


X°(X,p) est l'espace des fonctions dites de puissance p-ième sommable par rapport 


à, muni de la semi-norme allés toi |£(x)l° dp(x}Ÿ; il n'est pas séparé, et l'espace 
séparé associé est L’(X,j), espace des classes de fonctions de puissance p-ième som- 


mable, 
(4) BOURBAKI, Int., Ch. Ill, parag. 2, n° 6. 
6* 
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LES es) - MESURES BORNÉES, L'ESPACE 36° = 3°(X), 1= p = © 


On appellera #"(2) l'ensemble des couples (£,p) d'une mesure ft} 0 
et d'une fonction f€#£°(X,y). On dira que deux couples (£,p), (g,v), sont 
équivalents, et on écrira (f,p)(g,v), si les mesures f{Plh, glplv, sont 
identiques. On établit ainsi sur #°(X) une relation d'équivalence; la classe 
d'équivalence d'un élément (£,p) sera notée (£,u), on aura donc(f,p) € (£,p). 


1 
C'est une telle classe d'équivalence que nous appellerons une (—)-mesure 


bornée. L'ensemble de ces classes, ou ensemble quotient de Y(X) 
par la relation d'équivalence, sera noté %'°{(X). Pour toute mesure 


H Z 0, et toute fonction a > 0 telle que L soit localement H- intégrable, 
on a LOTS)  (f Va ; +) ; comme on peut toujours choisir «a telle queË 


soit une mesure bornée, on voit que dans toute classe d'équivalence 
de PP(X), il existe des couples (g,vV) pour lesquels Y est une mesure 
bornée. Si #% EH"(X), et si on note £[Pl la mesure ftlu, (f,H)EE, on voit 
£— Elflest une bijection de %#K°(X) sur l'espace %'(X) = M(X) des 
mesures bornées (c'est manifestement une injection ; mais c'est 
aussi une épijection, car siV est une mesure bornée, V = ælV|, où a est 
Iv| mesurable et de valeur absolue 1, alors alÿlest dans AN à © ec: 


. ds 
(«51 Iv1)= Ÿ est telle que £lP=V), si &(Pl= VE M (X), nous poserons Ÿ = vl?] 
Plus généralement, si 1< q <c, et si à chaque &% € SX) on associe 


l'unique élément & de H4(X) tel que &A1= EP, on peut poser & = &(/; &— ll 


est une bijection de #{X) sur HU{X); si IÇ{r<,;,ona EONCE Er) Si 
p 
Si 


(£,p) = LA MX), alors (fi pe) = fl. 


s 
Soient (f,u), (g,V), deux couples quelconques de #”(X). Soit À une 
mesure > 0 quelconque majorant pety. On peut écrire p=a, V=$à, 
où a et $ sont des fonctions À -mesurables, définies À -presque partout, 
comprises entre 0 et 1. Les mesures flPl H> glPlY ne sont autres que 
(£{Pla), (gl{P1B) }; bien que f[Pl soit seulement k-mesurable et non néces- 
sairement }-mesurable, flPla est }-mesurable, Et de même glrl $ est 
\-mesurable. Alors, pour que (£,p) et (g V) soient équivalentes, il faut et 
il suffit que flPla = gl18, \-presque partout, Ce résultat doit être indé- 
pendant de la mesure À considérée, puisqu'il peut s'exprimer indépendam- 
ment de À par l'égalité des mesures 1BLe glPl), Autrement dit si, pour 
une mesure À » 0 particulière, ma jorant petv, avec H =) Ve 8 Ton 


Examinons d'un peu plus près la relation d'équivalence dan 4°). 


P, P 
afVa =gVB À-presque partout, les couples (f,p),(g,v) sont équivalents, 
et on a la même relation pour toute mesure À > 0 majorant pH ety. 


On peut se borner à supposer que À domine u et V, autrement dit que 
H=ax,V- BA, où à et B sont des fonctions AU définies À- presque 
partout, À-localement intégrables, et la relation d'équivalence s'écrit 


’ P p 
toujours :'"fVa = g VB, À-presque partout. 
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L'espace X étant toujours le même, nous le supprimerons désormais 


dans toutes les écritures et nous écrirons ke 4, L°(p): au lieu de Hix), 
0), €" Cp). 


STRUCTURE D’ESPACE VECTORIEL SUR %° 


Soient & € JP, n € 6°. On peut toujours trouver dans ces classes de A 
deux éléments de la forme (f,1),(g,A), c'est-à-dire faisant intervenir 
la même mesure À »} 0; car, si (f,H) et (g,,v) sont des éléments de ces 
deux classes, et si À est une majorante de H ety,fH=a À 5Y = 1, 0on.peut 


prendre comme nouveaux éléments de ces classes (f Wa ,)1) et (g VB, re 


Alors nous définirons £ +n comme la classe de (f+g,À}). Cette classe 
est bien indépendante des couples (f,1),(g,1) choisis dans $et n respec- 
tivement ; en effet, si(f',1'), (g',1') sont deux autres couples des classes 
&et net si À'' est une mesure » 0 majorant À et \',onaXk=7Yl",l'=T!})", 
OK T<I,0K 7! K 1, Ÿ et Y' étant |''-mesurables; alors l'équivalence de 


(f,À)et (f',1') se traduit par l'égalité f ŸT ST Vré \''-presque partout; 
p 
de même g Vs g' VT !, l''presque partout ; alors (f+g) VT = (£'+g') ŸVY , 


\''-presque partout, ce qui traduit l'équivalence des couples (f+g)} et 
(f'+g',\'). Si maintenant k est une constante complexe, on définira de 
même k Ë comme la classe de (k:L,p), où (f,p) est un élément arbitraire 
de la classe &. Les lois d'addition et de multiplication par les scalaires 
complexes ainsi définies satisfont clairement à tous les axiomes des lois 
correspondantes des espaces vectoriels. 


On sait d'ailleurs que si M et N sont des mesures et si F est une 
fonction de 2 variables complexes, continue et homogène de degré 1, 
on peut définir la mesure F(M,N). Ici précisément si nous posons 


F(u,v)= (ut?) + vll} {Pl on voit que (E+n)/l est égal à F(Elrl,nll). 


NORME SUR %#° 
1 
On peut normer #°en posant ||E|p= (11€ L?|| m)° . Cette définition est 
légitime, toutes les propriétés exigées pour une norme étant vérifiées, Si 
({,;W)EE,0ona P 12 P . 
k Ne, =CL 1Gol" ap)" 1 12?6p) 
K'ainsi normé est un espace de Banach, autrement dit il est complet. 


Soit en effet E,, &,,... &h,... une suite de Cauchy dans #°. Choisissons 
des représentants (f;, fn) € %n; on peut toujours supposer chaque mesure 


Un bornée ; en remplaçant au besoin (£ns Hn) par (EE), k > 0, on peut 
même supposer que || Hh|| Cons alors, en posant À =ZUn, on voit que À est 


une mesure >» 0 majorant toutes les ph, ce qui permet de remplacer les 
couples (£n pen) par des couples équivalents (g, , 1). 


Autrement dit, pour toute infinité dénombrable d'éléments de #?, on 
peut toujours supposer que les couples qui les définissent font intervenir 


une même mesure } > 0 de Ab 
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Alors le fait que les Ésforment une suite de Cauchy dans #°revient à 
dire que les g, forment une suite de Cauchy dans XL? (1). Comme cet espace 
est complet d'après Fischer-Riesz, il existe g€%° (X) telle que, pour 
n —, gn converge vers g dans £° (1); alors (g,1) € #6", et Éntend vers 
&=(g,1) pour n—> dans %°. 


DÉFINITION DE %° COMME LIMITE INDUCTIVE 


On peut retrouver l'espace #°à partir du concept de limite inductive. 
Soit p une mesure > 0 sur X. Elle définit un espace L° (y). Cet espace 
peut être identifié en tant qu'espace normé à un sous espace Hu) de H'; 
si en effet f EL’ (u), f est une classe de fonctions; si f est une fonction de 
cette classe, f€ L°(u), et la classe de (f,p) est un élément & de H”, qui 
est indépendant du choix de f dans la classe f'; en outre 


IRAIF = | f'|l Cp) 


Si maintenant À >p, on voit qu'il existe une injection naturelle, 
isométrique, de L? (p) dans L° (A); ilexiste en effet une fonction, 0O<a«1, 
À-mesurable, telle que H = a ; alors f—+— Va f'est bien une telle injection 
isométrique ; de plus on a la relation de transitivité entre les injections 
LP () —{P(1) —- 32 Alors, comme ‘#'est la réunion des +): sa défini- 
tion montre qu'il n'est autre que la limite inductive (au sens algébrique) 
des LP(); relativement à la relation d'ordre filtrante des mesures . 
Montrons que J'"est aussi la limite inductive topologique (1) des K\y). 
A priori la topologie limite inductive est plus fine que celle de #”puisque 
toutes les deux sont localement convexes, induisent sur #" ) une topologie 
moins fine que celle de J61 p) (en fait, la topologie de Rp) elle-même), et 
que la limite inductive est la plus fine à posséder cette propriété. Nous 
devons donc montrer que la topologie de #°est plus fine que la limite 
inductive. Comme #°’est normé, il suffit de montrer dée: Bi 87 em. 
est une suite convergeant vers © dans #", elle converge vers Odans la 
limite inductive. Or, comme plus haut, on peut prendre des couples (g,,)) 
des classes £n, avec une même mesure À. Alors les Ë\ convergent vers 0 
dans %°(1), donc a fortiori dans la limite inductive, d'où la conclusion. 
Nous sommes là dans une des rares circonstances où une limite inductive 
d'espaces normés est normée, On voit donc qu'on aurait pu définir a priori 
%°comme la limite inductive des LP (#); relativement à la relation d'ordre 
filtrante À > et aux injections correspondantes L° (UE 


ÉTUDE DES SOUS-ESPACES &° (y) - DÉCOMPOSITION DES SOMMES 
DIRECTES 


1°) Soient À et b deux mesures > 0, et supposons que À domine PE 
autrement dit Lx ak , localement À-intégrable. 


(1) BOURBAKI, Espaces vectoriels topologiques, Paris, Hermann, 1953 (Actualités 
Scientifiques et Industrielles, n° 1189), chapitre Il, parag. 2, n° 4et 5. 
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. P : 
Alors (Ep) —(Va, À) est une injection isométrique de y) dans 
HA) : Rp) c #? (x). En RE si À et sont équivalentes, c'est-à- 
si chacune domine l'autre, #°(1) = # {H). 


2°) Soient # et V deux mesures > 0 étrangères, alors R{y#+V) est 
somme directe topologique de #'{u) et #{v). De plus, si ë, € #4 Y) ana 
décomposition & = 5x +%,, on a [El = [Eul°+|E6,|?, et AGE El) + 6,141 
pour 1ÇK q <. 


Tout d'abord, %°{(u) N H1v) = 0. Car si Eue R°(p), E,€ H'(v), on ne 
peut avoir &p= Ëy que si les mesures Eyllet £,lPlsont es. or elles sont 
étrangères, cela ne peut donc se produire que si elles sont nulles, Soit 
ensuite À = H{ +V et soit & € 3°(1). On a p=aX, V =, œetfi ne prennent 
que les valeurs 0 et 1,et si l'une vaut 0 l'autre vaut 1 etvice versa, Si alors 


(f,X)€E&,0ona (£,p)= Eu ER), (£,v ) = 6yE H°(v); mais (£p) ({Va ,x) et 


(£,v)æ (f VB à), et f=fVa +f VB, donc & = 5p+ $,, ce qui montre bien 
que R'(1) est une somme directe de #"{p) et H{v); le fait que c'est une 
somme directe topologique résulte de la relation entre les normes, qui se 
déduit de la formule 


JA a= fflæear+ fr p ax. 


3°) On dira qu'un élément & de #"?est atomique (resp. diffus) si la 
mesure bornée #$lPlest atomique (resp. diffuse) (+). 


Le sous-espace %5 des éléments atomiques et le sous-espace #64 des 
éléments diffus sont topologiquement supplémentaires dans 36°; de plus si 
€ HP à la décomposition # = Ea + £q, Ÿ4 atomique et Y4 diffuse, on a 


FE UP = Es? +11 641? 


Montrons d'abord que 3 1 #i= 0. Soient £, € #25 ,%4 € K? ; comme ElPl 
et gLpl sont l'une atomique et l'autre diffuse, elles ne peuvent être égales 


que si elles sont nulles. 


Soit ensuite $ € Y6°. La mesure À = |£{Pl| est somme d'une mesurep 
atomique et d'une mesure Y diffuse; g et V sont donc étrangères, et 2°) 
montre alors que £ € #°(}) est une somme £ = ep+ £), où Ep € kK° (y) ck: 
et 6,€ H°(v)C HI, d'où le résultat. 


MULTIPLICATIONS ENTRE LES 7€P 


SiEcH',n € Rte r > l, alors on peut définir un produit 


a 4T 
multiplicatif £n€%'. Soient en effet (f,A),(g,A) des éléments des classes 
E,n. Comme f est dans £° (1) et g dans Ÿ\ (A), on sait que fg € £'(A), et que 


(1) Une mesure est atomique si elle est somme dénombrable de masses ponctuelles, 
diffuse si aucun point ne porte de masse. 
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I fg Îgr D = IF Îlge ca) lg lpacx>. Alors (f g, 1) est un couple appartenant à 
une clasée & de #'. Montrons que & est indépendante des éléments choisis 
dans # etn. Soient donc (f',1'),(g',\) d'autres éléments, soit À" une 
mesure >» 0 majorant Àet X', et soit À = YA'', À' =T'X\'"". On a X''-presque 


partout : fTe= rh gré = g'y'é, dont f STr= “Da YF, dont (fg,X) et 
(f'g', À') sont bien équivalents. 


On posera & =Ën, Le produit ainsi défini est une application bilinéaire 
de norme < 1, de 3%°x 3%" dans #&". 


DUALITÉ ENTRE %° et ke += 1 


Si+-r = 1 (ce qui exclut les valeurs p=1,p'=1), et site%"”, 
P 


nek,Ën est une mesure bornée, donc ayant une masse totale 


fe d(fn)=<£5n ; 1>: Alors (Ein) — fa (En) est une forme bilinéaire 
x 


continue de norme < 1 sur R°x 8°. Montrons que cette forme définit 
chacun des espaces %°, %°, comme le dual de l'autre. Tout d'abord tout 
élément n de #° définit la forme linéaire continue £ —+ <En;: 1 > sur #", 

[#1 


de norme < Inll; mais sa norme est exactement nl, can sufsnte, 


oma Ee", El, =Inl,é En =Inll, etc n, 1» =Inf% =|6l, Inl 


pe 


! 
Il en résulte que #°est un sous espace vectoriel normé de (36°). Il reste 
à montrer que toute forme linéaire continue € sur %° est de la forme 


É—<%n , L > pour un n € H?'convenable, Si p est une mesure }» O0, la 
restriction de Ÿ à R°(y) est une forme linéaire continue, donc, le dual de 
L? (p) étant La (x); il existe un élémentn (y) de #°(y) tel que, sur #°{(pu), { 
coincide avec la forme %—»<E%n (y), 1 >. De plus In (ler < { puisque 
In (p)ll# est la norme de la restriction de { à °(4). Mais d'après la défi- 
nition même de la norme de la forme linéaire continue £,Il£|| est la borne 
supérieure des |n () lp lorsque H varie. Soit donc pH, b,... Un, une suite 
de mesures telles que In (er) ] p tende vers [RAI pour n—ræ, Comme #'(u) 
coincide avec (ay) si a est une fonction continue > 0, on peut toujours 


supposer les Hn bornées et choisies de telle sorte que || fn Îlm cer alors il 


2 
existe une mesure À =>) Hnqui majore toutes les kn, de sorte que l'on a 
nécessairement |n(x)|l> = |l{| . Montrons qu'alors { coincide avec la forme 


E—<En(X), 1 > . Il en est bien ainsi sur #'(1). Comme #°est la réunion 
des #’(6), il suffit de démontrer qu'il en est ainsi sur tout #°(8) pour À > > 
autrement dit quen (8) =n (1) pour 8 >X. Or, si »\,on a 8 = X\:+7%, où 
A1 est équivalente à À et x étrangère à À. Alors #'’(0) est somme directe 
topologique de #'(1) et de #°(n). De même #°(B) est somme directe topo- 
logique de #”{(1) et de %°(n). Ces deux décompositions sont duales, car, 
dans la dualité entre #°(@) et #°(0), 6) et H°(x) sont trivialement ortho- 
gonaux,de même que #°(r) et H'(1) (Soient, par exemple, KE" dis R°(X:) À 
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x € #°(r).Onak:=a8 ,n =B0,aet B ne prenant que les valeurs 0 et 1, 
l'une prenant la valeur 0 quand l'autre prend la valeur 1 et vice versa. 
Alors, si 


P ; 
(£,x)ro(f Va,8) € % etsi (g,r)(g VB,8)Enx, 
on a £ g Va VB- 0, donc Eynn 0 
etpar'suites<lés ner > 0). 


Mais alorsn (À) qui coïncide sur #'(X) avec la restriction de { ou de 
n(8), n'est autre que la composante de n(8)e %°’(6) sur #°(X\) dans 
la D D directe, et de mêmen (a) n'est autre que sa composante 
sur #° (x). Mais alors In(8)lé = fn OIL +]In(x) |} ; et comme les deux 
premières quantités valent 1£|, on an(r) =0,doncn(8#)=n(X), c.q.f.d. 


L'ESPACE DE HILBERT %#° 


La forme hermitienne (E,n)—> <En, 1 > définit sur %° une struc- 
ture préhilbertienne, compatible avec sa structure d'espace normé: 
[R2 | S'sts le Comme 36° est complet,c'est un espace de Hilbert,. 
Remarquons que les sous-espaces 365 et 36j (page 7) sont orthogonaux, et 
que, si p et v sont deux mesures étrangères, #°*(u) et 4&‘(v) sont orthogo- 
naux, En particulier, si £ (a) est la mesure formée de la masse unité au 
point a de X, les vecteurs £(a) = (1,E(a)) =(E€( E(a)}?] sont deux à deux ortho- 
gonaux. 


STRUCTURE D'ORDRE SUR 3° 


Ondiraque & € H°est DAT Elrl estune mesure > 0; alors si (£,p) CE, 
f estu -presque partout » 0 et inversement. Cette structure d'ordre est 
compatible avec la structure vectorielle : si E > 0," > 0, et si k estun 
scalaire > 0,onaË+n2>o0,k E > 0. 


Comme la structure d'ordre est transportée de celle de M(X) par la 


bijection g— 05], X° est un espace de Riesz complètement réticulé (1). 
É et n sont étrangers si et seulement si les mesures sont PRET 
alors (E+n)lel = ElPl4 nlPl, sis, p)=É$EeX", on a (ff,p)=Et, (fu)= "€, 

(Hp = LE. 


Si E € H'°est > 0, alors ER € Hfest aussi > 0; nous l'écrirons dans 
ce cas ##, Alors IEMII=1 ES. 

Si F2 > Oest une mesure bornée, l'élément (1,4) de 7° peut s'écrire 
LH? ou Va. Par ns. Ne ) est la masse unité au point a de X, 


(1,a) € s'écrit VE (a 


(1) BOURBAKI, Int., Chapitre Il, parag. 1, n° 3, et chapitre Ill, parag. 2, n° 4, 
théorème 3, page 54. 

(2) Quand on considère la classe (f,p) d'un couple (f,p),il importe de dire pour 
quelle relation d'équivalence, c'est-à-dire pour quelle valeur de p. Ainsi la classe de 
(1,€ (a) ) s'écrit Vela) dans #°. 
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LES e) - MESURES QUELCONQUES - LES ESPACES #. 


On généralise toutes les définitions précédentes, en introduisant 
l'espace 4 des couples (£,p), où f est localement de puissance p-ième 
p-intégrable, ce que nous écrirons f € ic (H). On dira que pertes) 
sont équivalents si les mesures (non nécessairement bornées) flP > glplv, 


re. AE l F : 
coincident. Une classe d'équivalence sera une Derpesure (non nécessai- 
2 il BE: 
rement bornée), L'espace des peelres sera noté #j.. Ki.est l'espace 


de toutes les mesures. Nous laissons au lecteur le soin d'étendre les 
propriétés précédentes, #ÿ.n'est pas normé, mais c'est un espace de 
Fréchet, si on lui donne la famille des semi-normes N\4 : 


(li au(x) }, (Ep) EE, A compact de X. 


df.est limite inductive des L'HAMNES Et (PE Naturellement iln'y a 
pas dualité entre 96% et Ji. mais entre 34, et Hémp(sous-espace de 8° 
formé des éléments à support compact, avec une topologie limite induc- 
tive ; le support de E€ K° est par définition, celui de El] + 


MULTIPLICATION DES a) - MESURES PAR DES FONCTIONS 


Soit E € 6, et soit g une fonction appartenant à #}, (|&|°). Alors on 
peut définir g&6 € %f. par g € = (glrl El] )(?] (l'expression entre parenthèses 


est le produit de la mesure #[?l par la fonction glfl localement |&{Pl| -inté- 
grable). Si ( JEE, on voit que fe efhaluhs ety(fain) 257 One 
(ge) SG) El e x. k à 

Si E € Hi. (p), on à aussi gËE Rip). Si EE R°, et g € £° (IEP), on 
a aussig# €", et |gEl, = glzce) 


f, 
ct) 


On à enfin la règle suivante d'associativité : si g € Li (1El”), et si 
p 
h € .(l(8Ë)l?), alors gh EX (IEl) et h(gE)=(he)E. 


EXPRESSION DE (f,u) PAR fr 


Soit & € Hi, et soit (f,m) EË. Alors f € £i. (y) = SAT (IV 1?) (avec 


+ P 
(1,p)= \/ pe € Hey, et on a fu = Ë. La loi d'associativité donne en outre 
sous une forme bien plus suggestive la relationd'équivalence(f,u) (f Va, x) 
pour #=ax. Cette relation d'équivalence s'exprime simplement par 


l'égalité \ 
£ Vu = Var = (Va) Va 


Remarquons que 468$. (H) n'est autre que la bande engendrée (1)par Ve 
dans l'espace complètement réticulé 38/.. 


(1) BOURBAKI, Int., chapitre Il, parag. 1, n° 5. Rappelons que si a appartient à 
la bande de b > 0, on dit que à est dominé par b,. 
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DÉCOMPOSITION DE LEBESGUE 


Soient Ë et n deux éléments de 4#.. Comme %#\,est un espace de 
Riesz, on peut écriren = &1 +0,où £, est dominé par |Ë| et & étranger àE; 
une telle décomposition est unique. Mais puisque &1 est dominé par|ël|, 


on a E{Pl= flPl|El", où flPl est une fonction localement |Él-intégrable; d'où 
la décomposition unique de Lebesgue : 


n'ENISEFIES, 


où f € £ÿ,. (1Ë[?), et où & est étrangère à £. Si E est une E-mesure diffuse 


loc 


(par exemple si Ë est la racine p-ième de la mesure de Haar sur un groupe 
localement compact non discret), f £ est diffuse, et & peut se décomposer 
en une composante atomique &, et une composante diffuse &,. Sip=2, les 
3 termes f£, &,, C4 sont orthogonaux dans l'espace de Hilbert %°. 


APPLICATIONS A LA TRANSFORMATION DE FOURIER SUR LES 
GROUPES ABÉLIENS LOCALEMENT COMPACTS 


Soit X un groupe abélien localement compact, dénombrable à l'infini 
(1). Il y à une infinité de mesures de Haar > 0, et si le groupe n'est pas 
compact, aucune d'elles n'est plus naturelle que les autres, Mais comme 
toutes sont proportionnelles à l'une d'elles, que nous noterons dx, elles 
définissent toutes la même bande, que nous noterons #°(dx). Soit d& la 
mesure de Haar associée à dx sur le groupe dual R de manière qu'on ait 
la formule de Parseval-Plancherel : alors la mesure de Haar associée à 


GE Rkemees 
k dx est ss Soit alors une classe de fonctions appartenant à LP(dx), 
1< p < 2; elle a, par rapport à dx, une image de Fourier FE D (d&) ; 
1 
+ 1. Soit kdx une autre mesure de Haar ; on a, dans #°, 
P 
f he = Vi dx . 
P 
à f S 
L'image de Fourier de KS relativement à la mesure de Haar kdx n'est 
P 
2 P ZÆ 
SRE VEN d EN P , 
autre que k =fk#etona, dans #°, Îk? a =tf Vds. 
P 


On voit donc que la transformation de Fourier définit intrinsèquement 
(c'est-à-dire indépendamment de tout choix d'une mesure de Haar)une 
application linéaire continue de norme & 1 de %”(dx) dans H#°{(dR) (et, si 
p = 2, c'est une isométrie de l'un sur l'autre). Cette transformation se 


définit comme suit : soit dx! (= k dx) une mesure de Haar > 0 arbitraire, 
NS 


p 
dR' Fe _ la mesure associée sur %; pour E € 4”(dx), posons £ = f'\/ dx'; 


calculons l'image de Fourier ft de f' relativement à la mesure de Haar dx'; 
alors & =f Ÿ dx’ est indépendant du choix de la mesure de Haar dx! 


(1) Voir A. WEIL, L'intégration dans les groupes topologiques et ses applications, 
Paris, Hermann 1940 (Actualités Scientifiques et Industrielles, n° 869). 
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APPLICATION AUX FONCTIONS D’ONDES DE LA MÉCANIQUE 
QUANTIQUE 


Supposons un système physique dépendant d'un nombre fini de para- 
mètres. Une position du système sera en général un point q d'une variété 
indéfiniment différentiable V". Dans une région assez petite de la variété, 
on pourra prendre des coordonnées locales q,, q,,...,, mais non en 
général dans la variété tout entière. On dit habituellement en mécanique 
quantique, qu'un état du système est défini par une fonction d'onde Wet 
qu'alors la ‘'densité'' de probabilité de présence est IV ; ‘'densité'' s'en- 
tend par rapport à la mesure dgq,, dq, ... dq,. Mais ceci est valable 
seulement dans une région assez petite de la variété relativement à un 
système de coordonnées locales. 


: 1 À 
En réalité W n'est pas une fonction, c'est une (5) - mesure bornée, 


c'est un élément de l'espace #°(V"); alors Ÿ W =[YI° est une mesure bor- 
née > 0, qui se trouve avoir la masse totale 1 si |Wll: = 1, et qui est la 
probabilité de présence. Ceci permet d'obtenir des ''fonctions d'ondes'' ou 
toute la probabilité est concentrée en un point a de V" ; il suffit de prendre 
Y'= VE (a). Néanmoins, en général, l'hamiltonien H n'opère pas sur 4‘(V") 
tout entier. 


Soit dQ une mesure > 0 ayant la propriété d'avoir une densité indéfi- 
niment dérivable > 0 par rapport à dq, dq, ... dq, sur toute carte locale, 
Toute autre mesure ayant la même propriété est de la forme a dQ où aest 
une fonction > 0 indéfiniment dérivable sur V". Alors la bande 36° (dQ) est 
intrinsèquement attachée à V". Dans les cas usuels, l'hamiltonien n'opère 
que sur #*(dQ), de sorte qu'on devra en général supposer W € #°(aQ), 
dont |WI° aura bien, sur toute carte locale, une densité par rapport à 
dq, ... dq, ; la densité de W par rapport à \/ dq, ... dq, sera la fonction 
d'onde, dans le système de coordonnées locales considérées, Cette obli- 
gation de considérer des éléments de %°(dQ), dans les cas usuels, nous 
parait très regrettable. 


THÉORIE DES PROBABILITÉS 
ET MECANIQUE QUANTIQUE 


par 


J. ULLMO 


Un texte récent de Heisenberg, publié dans le livre jubilaire en 
l'honneur de N. Bohr (1), donne l'occasion de revenir sur l'interprétation 
de la mécanique quantique et la ‘'querelle'' du déterminisme : l'interpréta- 
tion dite de Copenhague, généralement admise des physiciens pendant un 
quart de siècle, y est exposée avec un grand effort de clarté, soutenu par 
la critique qui y est faite des diverses tentatives d'interprétations différen- 
tes proposées ou reprises ces dernières années. 


Grâce à ce jeu d'affirmations et de critiques, bien des points appa- 
raissent en pleine lumière, portant sur la philosophie de la connaissance 
et l'application de la probabilité au monde microscopique : ce sont ces 
points que nous voudrions faire ressortir ici, pour l'intérêt qu'y a toujours 
montré M. Paul Lévy. 


Il convient de rendre un hommage liminaire à la modération et au 
scrupule dont fait preuve Heisenberg, tout au cours de son exposé, en 
contraste avec certaines outrances antérieurement rencontrées parmi 
ceux qui ont développé l'interprétation ‘'indéterministe!'', Et l'on pensera, 
sans doute, que les critiques auxquelles celle-ci a été soumise n'ont pas 
été inutiles, n'eussent-elles abouti qu'à cette forme épurée de la théorie 
de Copenhague, où iln!'y a presque plus rien à redire, parce que les 
aspects les plus bizarres, aux implications malencontreuses,en ont été 
éliminés. 

On pourrait pourtant penser à première vue que ces aspects subsis- 
tent, lorsqu'on lit les affirmations suivantes : ''le plus important de ces 
aspects (de l'interprétation correcte) était l'introduction de la probabilité 
comme une nouvelle sorte de réalité physique ‘l'objective'', Ce concept de 
probabilité est étroitement lié à celui de possibilité, la ‘'puissance'' de la 
philosophie naturelle des Anciens, tels qu'Aristote; il est, dans une cer- 
taine mesure, la transformation du vieux concept de ‘puissance'! d'une 
notion qualitative en une notion quantitative'' (pp. 12-13). 


Pour confirmer ceci, H. nous rappelle que l'onde de probabilité intro- 
duite par Born en 1926 l'est relative à un processus individuel. (Elle) 
décrit le comportement, non d'un grand nombre d'électrons, mais seule- 
ment d'un seul système de particules en nombre fini'!' (p; 13). 


Il dira plus loin que ‘'la transition du possible à l'actuel ne peut être 
omise de l'interprétation de la théorie quantique'' (p. 22). 


(1) Niels Bohr and the development of physics (Pergamon Press, London 1955) 
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Si l'on se borne à l'apparence, les citations qui précèdent répètent les 
thèses extrêmes sur la probabilité immanente à l'objet individuel et la 
négation radicale de la causalité (deux objets représentés par la même 
fonction d'onde sont identiques, et pourtant n'évoluent pas nécessairement 
de même), d'où ont été tirées par d'autres auteurs les conséquences sur 
la liberté de l'Electron,la manifestation positive du Hasard, ou la négation 
du principe de raison suffisante (1). La référence insistante à Aristote, 
avec l'exhumation de la conception vénérable du ''passage de la puissance 
à l'acte'' semble accentuer encore ces thèses. 

Et pourtant rien de tel ne ressort du contexte, et il serait déplorable 
qu'on isolât les citations précédentes pour défendre quelque position philo- 
sophique préconçue. Replacées dans la discussion d'H., et éclairées par 
elle, les affirmations en cause ne justifient plus d'outrances philosophi- 
ques ; elles rentrent dans le cadre d'une épistémologie acceptable, d'une 
conception admise de la probabilité : c'est ce que nous allons essayer de 
rendreiclaire 

Constatons tout d'abord qu'H. s'oppose avec la plus grande fermeté à 
deux attitudes philosophiques opposées, qui ont pourtant en commun de 
méconnaître la démarche authentique de la pensée scientifique : attitudes 
que nous désignerons par commodité sous les noms de positivisme et de 
matérialisme. 

Nous nommons positivisme le parti-pris de refuser la distinction 
entre la réalité physique, et l'expérience que nous en prenons - entre la 
nature et la connaissance. Sous prétexte d'éliminer la métaphysique, on 
refuse l'être à tout ce qui n'est pas atteint par l'expérience; on refuse 
même d'en faire un objet légitime pour la pensée : c'est la philosophie des 
llpseudo-problèmes!!, 

Nous nommons matérialisme le parti-pris de soumission absolue à 
l'objet, l'affirmation que la réalité physique est accessible immédiate- 
ment; elle se ''reflète!' directement dans la pensée, et n'est en rien défor- 
mée ou conditionnée par les propriétés de l'esprit ou les difficultés de la 
connaissance. C'est la philosophie de l'objectivité pure. 


Ces philosophies ennemies négligent toutes deux la polarité essen- 
tielle de la science, qui est affrontement de la pensée et des choses; la 
connaissance joint ces deux pôles : sujet et objet, chacun d'eux la soumet 
à sa tension. Le positivisme veut oublier qu'il y a des objets qui résistent 
à la connaissance ; le matérialisme oublie le rôle inévitable du sujet, qui a 
du mal à construire la connaissance et peut infléchir celle qu'il construit. 
Comme le dit H : ''La science naturelle n'est pas la Nature elle-même, 
mais une part de la relation entre l'Homme et la Nature,et par conséquent 
dépend de l'Homme, 


Dans ce cadre philosophique, les confusions que nous avons dénoncées 
ailleurs (2)ne peuvent se produire, Le réel est distingué de la connais- 


(1) Cf. par J. Ullmo : La mécanique quantique et la Causalité, Revue Philosophi- 
que, juillet 1949 (pp. 257-282) et octobre 1949 (pp. 441-473) - Le Théorème de von 
Neumann et la Causalité, Revue de Métaphysique et de Morale, 1951 (pp. 143-170). La 
Crise de la Physique Quantique (Hermann, Paris 1955). 


(2) Théorème de von Neumann'' (loc. cit.), p. 154. 
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sance et de la représentation, d'une part; d'autre part, l'objectivité 
n'apparait plus comme un absolu posé a priori; elle se définit par l'élimi- 
nation du sujet, du rôle de l'observateur, dans la connaissance expérimen- 
tale, et l'on peut discuter des moyens et des limites de cette élimination. 


Reprenons maintenant l'affirmation de H. suivant laquelle la fonction 
d'onde représente un système unique; implique-t-elle vraiment que la 
probabilité qu'elle fournit est intrinsèque au système, qu'elle appartient à 
son l'essence!" (n'ayons pas scrupule à utiliser Aristote, puisque H. l'a 
fait avant nous) et lui confère ainsi une possibilité de choix entre ses 
futurs possibles ? Il n'en est rien, puisque H. réintroduit aussitôt un 
ensemble de systèmes décrits par cette même fonction d'onde ''pour autant 
que l'expérience en question peut être répétée aussi souvent que nous 
voulons'! (p. 13). Ces systèmes préparés de même, que nous avons pro- 
posé de nommer semblables, H, se garde bien de les déclarer identiques, 
car il sait bien que l'identité est une notion absolue qui s'applique concep- 
tuellement à la réalité profonde, alors qu'il n'a en vue explicitement que 
la notion, toute relative, purement opératoire, de systèmes produits par 
le même montage expérimental, sur lesquels par conséquent toutes nos 
informations sont les mêmes : égaux devant notre connaissance, non 
identiques en soi. Il précisera plus loin (p. 23) que les interactions d'un 
appareil de mesure avec le système et avec le reste du monde sont 
partiellement indéfinies''; il en est évidemment de même pour l'appareil 
de préparation. Chaque fois qu'il est mis en contact avec le monde exté- 
rieur, notre connaissance du système est estompée par notre ignorance 
du détail des interactions qu'il subit. La naissance du système est le plus 
inévitable de ces contacts, il est donc bien clair que notre connaissance 
initiale en est incomplète, et l'introduction de la probabilité correspond 
naturellement à cette ignorance partielle, Comme le dit H. (p. 27): 
! La connaissance de l'actuel (c'est-à-dire ce qui se manifeste dans l'es- 
pace et le temps) est par nature toujours une connaissance incomplète!!, 
Tout le malentendu sur la causalité et le principe de raison suffisante, se 
trouve ainsi élucidé : il n'y a pas dans la nature de Hasard actif qui fasse 
diverger sans raison des systèmes identiques et ruine par là l'exigence de 
causalité, il y a dans notre connaissance une part d'ignorance qui se 
traduit en probabilité. 


La citation précédente est la thèse centrale de H., qu'il prend soin de 
souligner lui-même dans son texte. Elle va lui servir d'argument contre 
les accusations des matérialistes, tels Alexandrow et Blochinzew, qui 
reprochent à son interprétation d'introduire la subjectivité dans la théorie 
physique par l'intervention de l'observateur, et de violer par là l'objecti- 
vité de la science. 

Remarquons au préalable, pour déblayer le terrain, qu'ont été univer- 
sellement abandonnées aujourd'hui les fantaisies auxquelles H, lui-même 
s'était parfois abandonné, sur la soumission des phénomènes au sujet 
pensant : personne ne prétend plus que l'électron n'a de spin que depuis 
qu'on l'observe, ou dans la conscience de l'observateur. Le rôle de celui- 
ci, qui peut être remplacé par un appareil enregistreur, est un phénomène 
purement physique, et Berkeley n'a rien à faire en l'occurence, 
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Blochinzew utilise une formulation identique à celle que nous avons 
proposée, en parlant d'un ensemble ou collection de systèmes semblables 
produits par une préparation et représentés par une fonction d'onde, 
collection inséparable au sortir du montage de préparation, mais qui sera 
analysée en sous-collections séparées par un appareil de mesure qui lui 
est appliqué ultérieurement, et il dit : "En mécanique quantique, nous 
décrivons, non l'état d'une particule l'en soi!', mais Le fait que cette parti- 
cule appartient à telle ou telle collection. Cette appartenance est complète- 
ment objective ,et ne dépend pas d'affirmations faites par l'observateur". 


Il est remarquable que H. ne conteste pas cette formulation au moyen 
de collections de systèmes semblables, -qui est en somme implicite dans 
la sienne propre - mais seulement l'affirmation qu'on atteint ainsi l'objec- 
tivité parfaite; en physique classique, remarque-t-il, ''appartenir à une 
collection!" signifie toujours, au moins quand il s'agit d'un événement 
passé, une affirmation aussi sur le degré de connaissance du système par 
l'observateur (p. 23). 

En bref, H. répond à Blochinzew que toute connaissance incomplète 
implique un certain degré de connaissance pour tel ou tel observateur; on 
ne peut échapper à la nécessité de spécifier l'observateur et son degré de 
connaissance, et l'exigence d'objectivité absolue est ainsi mise en défaut. 


Nous reconnaissons là un paradoxe bien connu de la théorie classique 
des probabilités; dans son étude sur le fondement du calcul des probabili- 
tés (1), M. Paul Lévy reconnait que ''notre ignorance ne suffit pas pour 
que nous puissions considérer différents cas comme également probables', 
(p. 169). Dans son livre sur la Théorie de l'addition des variables aléatoi- 
res (2), il ajoute : ''Ensuite et surtout, au lieu de cette constatation néga- 
tive que nous n'avons aucune raison d'établir une différence entre les 
différents cas, il faut une raison précise de leur attribuer des chances 
égales'' (p. 7). Si l'on veut que la probabilité ne soit pas simplement 
constatée comme limite d'une fréquence observée - restant par là propre- 
ment incompréhensible - si l'on veut qu'elle se trouve justifiée rationnel- 
lement, une étude exhaustive de toutes les circonstances qui peuvent 
influencer les épreuves est nécessaire avant de pouvoir déclarer deux cas 
également probables (par le principe de raison suffisante),et rien n'assure 
que cette étude soit jamais achevée. 

À l'encontre de cette difficulté classique, la mécanique quantique jouit 
d'une situation privilégiée; car on y a affaire à des systèmes élémentaires 
sur lesquels n'agissent que les interactions ultimes qui s'exercent au sein 
de la matière et des champs qui l'accompagnent, on pourra donc négliger 
les troublantes grossières qui risquent d'affecter les phénomènes à notre 
échelle. Mais surtout, et c'est là l'apport décisif de la théorie quantique, 
on sait d'où vient la limitation de notre degré de connaissance : de l'inter- 
position obligée des instruments de mesure et de l'interaction ultime entre 
ceux-ci et les systèmes mesurés, En fait, la mécanique quantique fournit 
des renseignements statistiques sur cette interaction : le quantum d'action 
h (constante de Planck) de l'interaction ultime lie les couples de variables 


(1) Revue de Métaphysique et de Morale, avril-juin 1954, pp. 164-179. 
(2) Gauthier-Villars, Paris 1954, 
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dynamiques conjuguées; selon des schémas d'expériences connues, lors- 
qu'on mesure l'une d'entre elles, l'on perturbe l'autre; la fonction d'onde 
réduite après mesure donne la table statistique de ces perturbations; les 
relations d'incertitude d' Heisenberg résument plus sommairement la 
corrélation précision-perturbation au moyen de leurs variances respec- 
tives. 


Le type des instruments de mesure, pour une même grandeur, ne fait 
pas de différence, parce que seules entrent en jeu leurs structures pro- 
fondes (1) : pour une mesure optima, nous obtenons une connaissance 
maximale, toujours la même, représentée par la fonction d'onde réduite 
bien définie, qui traAuit le résultat de la mesure et inclut l'effet inconnu 
des perturbations auxquelles elle a donné lieu, 


C'est en ce sens que les probabilités (relatives à des expériences 
ultérieures)fournies par les fonctions d'onde peuvent être dites objectives : 
définition par un montage expérimental, mais indifférence au type d'appa- 
reil, reproductibilité, traduction d'une interaction ultime inévitable, mais 
réduite au minimum. Et c'est ainsi que s'éclaire la citation que nous 
avions faite au début, sur la probabilité comme une nouvelle sorte de 


réalité physique ''objective!'! : notre degré de connaissance est lui-même 
un phénomène objectif. 


Il est fâcheux sans doute que H,. ,qui rejette à plusieurs reprises''l'on- 
tologie matérialiste!' (pp. 21, 28), ait introduit le terme de ‘'puissance!! 
pour décrire ce qu'il appelle par ailleurs la transition du possible à 
l'actuel. Car l'expression aristotélicienne de passage de la puissance à 
l'acte évoque chez tout lecteur le réalisme ontologique de ses souvenirs 
scolaires, une propriété essentielle de l'objet : il n'y a qu'un pas de là à 
la ''liberté'' de l'électron ! 


Bien entendu, à la lumière de ce qui précède, il n'y a plus rien de tel 
dans la pensée de H. Il s'agit tout simplement de la plus classique des 
notions en probabilités classiques : l'épreuve dont le résultat accroît notre 
connaissance et peut modifier par là même les probabilités ultérieures, 
La fameuse ''réduction du paquet d'ondes!!', qui consiste à remplacer brus- 
quement la fonction d'onde connue juste avant une mesure par une autre 
fonction d'onde (un des termes du développement de la première en série 
de fonctions orthogonales associées à la grandeur mesurée)qui représente 
le résultat de la mesure, n'est rien d'autre que la traduction dans le 
formalisme de l'accroissement brusque de nos connaissances que nous 


procure l'épreuve de la mesure. 


H. développe une comparaison thermodynamique pour éclairer ce 
point : un morceau de métal peut émettre des électrons du fait de l'agita- 
tion thermique; un appareil de mesure est placé au voisinage qui enregis- 
tre l'émission d'un électron dont la vitesse dépasse une certaine limite, 
par un processus irréversible, par exemple le noircissement d'une plaque 
photographique, avec un réglage tel que cet événement n'ait lieu que de 
loin en loin. 


(1) Cf. La mécanique quantique et la Causalité (loc. cit.), p.283. 
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Si la température du métal est connue, sans qu'il soit iaolé du reste 
du monde, son énergie fluctue autour d'une valeur moyenne et la probabi- 
lité de l'émission d'un électron enregistrable peut être calculée, sans que 
le moment précis de son arrivée sur la plaque puisse être prévu. Si un 
observateur constate à un certain moment une telle arrivée, ''la transition 
du possible à l'actuel est par là même accomplie en ce qui le concerne'! et 
lil modifie en conséquence de façon discontinue la représentation mathé - 
matique'' du phénomène, ''Ceci correspond exactement à la réduction du 
paquet d'ondes en théorie quantique'' (p. 26). Rien de moins mystérieux. 


Nous avons repris cette comparaison parce qu'elle va nous permettre 
de préciser certains points relatifs aux rapports de la théorie des proba- 
bilités et de la théorie quantique. 


Pour le métal, étudié par la mécanique statistique (et où H. suppose 
que les électrons suivent les lois de la mécanique classique), il se déroule 
un processus stochastique dont le phénomène élémentaire est le choc des 
électrons entre eux ou avec les particules constituant le réseau cristallin 
du métal, chocs régis par une loi de probabilité instantanée, et qui peuvent 
intervenir à chaque instant. C'est ce processus stochastique qui définira 
la probabilité de présence d'un électron à un moment donné, et en parti- 
culier celle de l'arrivée sur la plaque enregistreuse, 


La probabilité de présence d'un système quantique (qui peut être un 
électron) est aussi définie par la fonction d'onde, mais celle-ci ne résulte 
pas d'un processus stochastique; elle est déterminée seulement par des 
conditions initiales et le fait de vérifier l'équation de Schrôdinger. Des 
tentatives intéressantes ont été faites pour déduire l'équation de Schrôdin- 
ger elle-même d'un processus stochastique, dont le phénomène élémen- 
taire serait, par exemple, une diffusion, mais rien de décisif n'a été 
obtenu. L'équation de Schrôdinger et les probabilités qui en résultent 
restent fondées, non sur l'intégration de processus élémentaires, mais 
sur le succès seul des prévisions expérimentales qu'elles permettent. 


Ces prévisions expérimentales introduisent la notion, fondamentale, 
en théorie quantique, d'observable. Ici encore, la comparaison thermo- 
dynamique va être utile. Tant que le système quantique est isolé du reste 
du monde, sa fonction d'onde évolue de façon régulière, suivant l'équa- 
tion de Schrôdinger; mais cette représentation par la fonction d'onde, dit 
H. l'est alors complétement abstraite et incompréhensible, ,.,; élle ne 
contient, pour ainsi dire, aucun élément physique'' (p. 26). De même le 
métal isolé aurait une énergie bien déterminée, mais nous ne saurions 
rien sur lui. 


La notion d'observable ne s'introduit que lorsqu'on met le système en 
relation avec un appareil de mesure, comme on a associé le métal et une 
plaque enregistreuse : la définition de l'observable est relative à l'asso- 
ciation système.- appareil, Elle implique donc que le système soit sorti 
de son isolement, comme le métal était mis en relation avec le monde 
extérieur par l'intermédiaire de la plaque. Le métal non isolé a une 
énergie fluctuante, c'est-à-dire que le métal étudié doit être considéré 
comme l'un échantillon choisi arbitrairement dans un ensemble canonique 
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de Gibbs'' (p. 25). De même, le système quantique mesuré, du fait qu'il 
est mis en relation avec le monde extérieur par l'intermédiaire de l'appa- 
reil de mesure avec lequel ses interactions sont partiellement inconnues, 
doit être considéré comme un échantillon choisi arbitrairement dans un 
ensemble statistique; c'est la collection des systèmes semblables dont 
nous avons parlé précédemment. 


s 


La comparaison choisie par H. démontre à l'évidence que l'état final 
de sa réflexion a complétement éliminé la ''probabilité en soi!!, assignée 
au système, et dont les conséquences philosophiques et épistémologiques 
pouvaient faire scandale, pour se rallier à la conception classique de la 
probabilité comme propriété d'un ensemble statistique imparfaitement 
connu. 

L'épreuve de la mesure sépare dans cet ensemble une sous-collection 
dé systèmes qui ont réagi de même à l'appareil; cette sous-collection, 
n'est formée encore que de systèmes semblables parce que les perturba- 
tions qu'ils ont subies du fait de l'appareil ne sont pas identiques : leurs 
probabilités seront données par une nouvelle fonction d'onde réduite qui 
manifeste l'accroissement brusque de nos connaissances sur la sous- 
collection qu'elle représente; après sa préparation, nous connaissons 
maintenant, en outre, sa réaction à la mesure, 


La fonction d'onde représente les probabilités relatives aux mesures 
de toutes les observables du système quantique. Mais l'ensemble statisti- 
que qu'elle décrit est modifié brusquement chaque fois qu'à lieu une 
mesure effective, et remplacé par un autre ensemble statistique décrit 
par une fonction d'onde réduite. Ceci explique qu'il n'a pas été possible 
de considérer simultanément les probabilités relatives à deux observables, 
- par exemple la position et la vitesse - et d'étudier leurs corrélations : 
celles-ci n'ont pas de signification expérimentale, car, contrairement au 
postulat ordinaire de la théorie des corrélations, l'épreuve que constitue 
la mesure d'une des observables modifie l'ensemble statistique auquel on 
a affaire et change brusquement les lois de probabilités, C'est ce qu'on 
nomme, en théorie quantique : l'interférence des probabilités. 

Il nous parait important de constater, pour conclure, qu'il n'y a plus 
de contestation sur les principes : le dernier état de l'interprétation de 
Copenhague est parfaitement acceptable pour les tenants des notions clas- 
siques de probabilité, de causalité et de déterminisme. Sur ce dernier 
point, on ne peut définir le déterminisme que par la prévision; il n'y a 
pas de difficulté à n'admettre qu'une prévision imparfaite, dès lors que 
la connaissance est incomplète; et l'écran interposé inévitablement entre 
la nature et l'homme par les instruments dont il doit se servir, justifie 
suffisamment cette limitation de la connaissance. 


Du côté de Copenhague, la conciliation est aussi manifeste : plus 
d'interdits, plus de négation a priori de la possibilité d'une théorie sous- 
jacente à la mécanique quantique actuelle, celle-là représentant l'objet 
individuel dont celle-ci décrit les ensembles. Les critiques d'Heisenberg 
ne portent plus que sur les insuffisances ou les lacunes des tentatives en 
ce sens, insuffisance et lacunes que leurs auteurs sont les premiers à 
reconnaitre, 
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Tant que la querelle faisait rage, nourrie surtout de malentendus et 
de vocabulaires abusifs, on pouvait prétendre fonder telle ou telle affir- 
mation audacieuse, relative à La théorie de la connaissance ou à la philo- 
sophie générale, sur l'efficacité constatée de la mécanique quantique, 
opposée aux tâtonnements des théories qui visent à la remplacer, Après 
l'exposé d'Heisenberg,il doit être parfaitement clair que le redressement 
de ces conclusions aventureuses ne saurait dépendre de telle ou telle 


entreprise : il est d'ores et déjà acquis. 
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